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Préface 


Cet ouvrage est le résultat de l’expérience pédagogique des dix dernières 
années à l’Université de Genève dans le cadre de deux cours de base semestriels 
de probabilités et statistique au niveau bachelor. Dans ces cours sont présentés 
les concepts de base des probabilités ainsi que de l’inférence statistique. Ces 
domaines ne sont pas des « sports pour des spectateurs » mais exigent un 
apprentissage actif des concepts présentés en classe. D’où la nécessité d’une 
grande quantité d’exercices qui permettent d’assimiler et maîtriser ces concepts. 

Dans cet ouvrage, on à recueilli 212 problèmes résolus, structuré en huit 
chapitres pour des raisons de clarté. À l’intérieur de chaque chapitre, les exer- 
cices sont séparés par thème, avec, pour chaque thème, un niveau de difficulté 
qui va en augmentant. À la fin de chaque chapitre, sont indiquées quelques 
références qui couvrent les aspects théoriques (non traités ici). 

Cet ouvrage peut être utilisé comme complément de tout livre de probabili- 
tés et statistique dans le cadre de cours de base dans des domaines aussi variés 
que les sciences économiques, la psychologie, les sciences sociales, les mathé- 
matiques, les sciences naturelles et la médecine. Il peut aussi être utilisé dans 
le cadre de cours de préparation à l’entrée dans un programme de master dans 
un domaine où ces connaissances sont exigées, ainsi que pour l’autoformation 
et la préparation d'examens. 

Plusieurs personnes nous ont aidés et inspirés au cours de ce projet. Nous 
tenons à remercier les assistants qui ont collaboré au cours, F.X. de Rossi, 
V. Czellàr, D. Conne, S. Lô. Le choix de certains exercices a été largement 
influencé par les travaux pratiques de la Chaire de Statistique Appliquée de 
l'École Polytechnique Fédérale de Lausanne (EPFL) et aussi par l'excellent 
livre de S.M. Ross (1987); que toutes ces personnes trouvent ici l'expression de 
notre gratitude. 

Pour terminer, nous tenons également à remercier Mme N. Huilleret, éditrice 
aux éditions Springer-Verlag France, et notre collègue le Professeur Y. Dodge, 
responsable de la Collection statistique et probabilités appliquées, pour leurs 
précieux conseils et leurs encouragements. 


Genève, juin 2006 Eva Cantoni 


Philippe Huber 
Elvezio Ronchetti 


Web: http://www.unige.ch/ses/metri/cantoni/Maitriser/index.html 
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Chapitre 1 


Probabilités élémentaires 


Introduction 


Les exercices de ce chapitre concernent les règles de base du calcul des pro- 
babilités. Dans beaucoup de problèmes élémentaires on calcule la probabilité 
d’un événement comme {nombre de cas favorables à l'événement} /{nombre de 
cas possibles}. Cela implique la connaissance de quelques formules de base de 
l’analyse combinatoire. Un autre outil utile est la construction d’une structure 
à arbre qui représente graphiquement toutes les séquences possibles d’une expé- 
rience répétée. Dans ce contexte, la notion de probabilité conditionnelle permet 
de calculer des probabilités complexes à partir de situations plus simples. Enfin, 
le théorème de Bayes est un résultat fondamental qui permet d’« inverser » une 
probabilité conditionnelle (voir en particulier l'exercice 1.19 et la suite l’exer- 
cice 2.1). 


Notes historiques 

La notion d’aléatoire et le concept intuitif de probabilité remontent à l’anti- 
quité mais c’est au XVI° et au XVIT° siècle que des règles élémentaires de 
calcul sont développées. La fameuse correspondance entre les mathématiciens 
français Pascal et Fermat en 1654, concernant un problème du jeu au hasard 
proposé par un noble de l’époque, le Chevalier de Mérée (voir l'exercice 1.6), est 
considérée comme le point de départ du « calcul » des probabilités. Parmi les 
grands savants qui ont travaillé par la suite sur des problèmes de probabilités 
on peut mentionner Jacob Bernoulli avec son oeuvre Ars Conjectandi (1713) 
ainsi que d’autres membres de cette famille unique de mathématiciens suisses, 
de Moivre avec son oeuvre Doctrine des chances (1718) et ensuite Laplace, 
Euler, Gauss, Lagrange et Legendre. Jusqu'au début du XX° siècle le domaine 
des probabilités resta un champ des mathématiques constitué d’un ensemble de 
résultats (intéressants et utiles) mais sans aucune base axiomatique. En 1900 
Hilbert énonça son fameux programme qui contenait comme sixième problème 
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le développement d’une structure axiomatique pour les probabilités. En 1933 le 
mathématicien russe A.N. Kolmogorov releva le défi en publiant un article qui 
présentait les fameux axiomes à la base du calcul des probabilités. Les proba- 
bilités devenaient alors un domaine des mathématiques à part entière comme 
la géométrie, l’algèbre ou encore l’analyse. 


Références (théorie) 


Il existe beaucoup de livres sur les probabilités. Deux bonnes références sont 
Ross, chapitres 1 à 3 [1] et Pitman, chapitre 1 [2]. 
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Exercices 
Calculs simples de probabilités 


SE 


Quatre hommes déposent leur chapeau au vestiaire en entrant dans un res- 
taurant et choisissent au hasard en sortant 1 des 4 chapeaux. Calculer les 
probabilités suivantes. 

1. Aucun des 4 hommes ne prend son propre chapeau. 

2. Exactement 2 des 4 hommes prennent leur propre chapeau. 


1.2 


Aurélie et Nicolas jouent aux dés. Ils lancent tour à tour 2 dés et observent 
les chiffres sortis. Quand la somme est 7 ou le produit 6, Aurélie marque un 
point ; quand la somme est 6 ou le produit 4, Nicolas en marque 1. Pour qui 
parieriez-vous ? 


1.3 


Parmi les familles de 2 enfants, la moitié se trouve être bien répartie, c’est- 
à-dire composée d’autant de garçons que de filles. En est-il de même parmi 
les familles de 4 enfants? (On suppose ici que chaque naissance donne avec 
équiprobabilité un garçon ou une fille.) 


1.4 


On tire au hasard 2 cartes d’un jeu de cartes de poker (52 cartes). Quelle 
est la probabilité qu’elles forment un black jack, ou autrement dit, que l’une 
soit un as et l’autre un dix, un valet, une dame ou un roi? 


1.5 


On classe 5 hommes et 5 femmes selon leur résultats lors d’un examen. On 
fait l'hypothèse que tous les scores sont différents et que les 10! classements 
possibles ont tous la même probabilité de se réaliser. On désigne le rang de 
la meilleure femme par X (par exemple X vaudra 2 si le meilleur résultat a 
été obtenu par un homme et le suivant par une femme). Donner la fonction de 
fréquences de X, c’est-à-dire P(X = i) pour 4 = 1,...,10. 
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1.6 


Problème posé par le Chevalier de Mérée à Pascal en 1654. 
Quel est l’événement le plus probable: obtenir au moins 1 fois 1 as en lançant 
4 fois un dé ou obtenir au moins 1 fois 1 double as en lançant 24 fois 2 dés? 


1.7 


On considère 3 événements À, B, et C!. 

1. À l’aide d’un dessin des ensembles À, B et C, trouver une formule per- 
mettant de calculer P(AUBUC si l’on connaît les probabilités de chacun 
de ces événements et les probabilités des intersections de ces événements. 

2. Démontrer cette formule à partir des axiomes de la théorie des probabi- 
lités. 


1.8 


On considère une famille avec 2 enfants. On suppose que la venue d’une fille 
est aussi certaine que celle d’un garçon. 
1. Quelle est la probabilité que les 2 enfants soient des garçons sachant que 
l’aîné est un garçon ? 
2. Quelle est la probabilité que les 2 enfants soient des garçons sachant qu’au 
moins un des enfants est un garçon ? 


1.9 


On jette 2 dés équilibrés. 
1. Quelle est la probabilité qu’au moins l’un d’entre eux montre 6, sachant 
que les 2 résultats sont différents ? 


2. Quelle est la probabilité qu’au moins l’un d’entre eux montre 6, sachant 
que leur somme vaut 5? Calculer le résultat pour toutes les valeurs pos- 
sibles de 1. 


Probabilités totales et théorème de Bayes 


1.10 


Un certain système a 5 composantes. Une panne du système est causée 
35 %, 30 %, 20 %, 10 % et 5 % des fois par une panne dans les composantes 
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À,B,C;,D et E, respectivement. On suppose que les pannes simultanées dans 
plus d’une composante à la fois sont si rares qu’on peut les négliger. 
1. Si une panne du système n’est pas causée par À, quelle est la probabilité 
qu’elle soit causée par B? 
2. Si une panne du système n’est causée ni par À, ni par B, quelle est la 
probabilité qu’elle soit causée par C ou D? 


1.11 


On compte respectivement 50, 75, et 100 employés dans 3 entrepôts À, B 
et C, les proportions des femmes étant respectivement égales à 50 %, 60 % et 
70 %. Une démission a autant de chance de se produire chez tous les employés, 
indépendamment de leur sexe. Une employée donne sa démission. Quelle est la 
probabilité qu’elle vienne de l’entrepôt C? 


1.12 


Tous les meilleurs joueurs du monde sont inscrits au tournoi de tennis de 
Diamond City pour lequel le 1° prix est une rivière en diamants. On estime a 
priori que Roger Federer à 4 chances sur 10 de gagner, Andy Roddick 3 chances 
sur 10 et Leyton Hewitt 2 sur 10. Si par hasard Roger Federer se blesse et an- 
nule sa participation au dernier moment, que deviennent les chances respectives 
de Andy Roddick et Leyton Hewitt de remporter la rivière de diamants? 


1.13 


Dans un pays où il naît autant de filles que de garçons, le docteur Gluck 
prévoit le sexe des enfants à naître. Il se trompe 1 fois sur 10 si c’est un garçon 
et 1 fois sur 20 si c’est une fille. Aujourd’hui il vient de dire à Mme Parisod 
qu’elle aurait une fille. Quelle est la probabilité pour que cela soit vrai? 


1.14 


Une compagnie d’assurance répartit les assurés en 3 classes : personnes à bas 
risque, risque moyen et haut risque. Ses statistiques indiquent que la probabilité 
qu’une personne soit impliquée dans un accident sur une période d’un an est 
respectivement de 0,05, 0,15 et 0,30. On estime que 20 % de la population est 
à bas risque, 50 % à risque moyen et 30 % à haut risque. 


1. Quelle est la proportion d’assurés qui ont eu un accident ou plus au cours 
d’une année donnée ? 
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2. Si un certain assuré n’a pas eu d’accidents l’année passée, quelle est la 
probabilité qu’il fasse partie de la classe à bas risque ? 


1.15 


Un avion est porté disparu. On pense que l’accident a pu arriver aussi bien 
dans n’importe laquelle de 3 régions données. Notons par 1 — &; la probabilité 
qu’on découvre l’avion dans la région à s’il y est effectivement. Les valeurs a; 
représentent donc la probabilité de manquer l’avion lors des recherches. On peut 
l’attribuer à diverses causes d’ordre géographique ou à la végétation propre à 
la région. 

Quelle est la probabilité que l’avion se trouve dans la 1° région (i = 1,2,3) 
si les recherches dans la région 1 n’ont rien donné? 


1.16 


À Londres il pleut en moyenne 1 jour sur 2 et donc la météo prévoit de la 
pluie la moitié des jours. Les prévisions sont correctes 2 fois sur 3, c’est-à-dire 
les probabilités qu’il pleuve quand on a prévu de la pluie et qu’il ne pleuve pas 
quand on a prévu du temps sec sont égales à 2/3. Quand la météo prévoit de 
la pluie, Mr. Pickwick prend toujours son parapluie. Quand la météo prévoit 
du temps sec il le prend avec probabilité 1/3. Calculer : 

1. la probabilité que Mr. Pickwick prenne son parapluie un jour quelconque ; 

2. la probabilité qu'il n’ait pas pris son parapluie un jour pluvieux ; 

3. la probabilité qu'il ne pleuve pas sachant qu’il porte son parapluie. 


1.17 


Le sultan dit à Ali Baba: « Voici 2 urnes, 4 boules blanches (b) et 4 boules 
noires (n). Répartis les boules dans les urnes, mais je rendrai ensuite les urnes 
indiscernables. Tu auras la vie sauve en tirant une boule blanche. » 


1. Quelle est la probabilité qu’Ali Baba ait la vie sauve s’il place les 4 boules 
blanches dans la 1° urne et les 4 noires dans la 2°? 


2. Idem avec 2b+2n dans la 1° urne et 2b+2n dans la 2°. 
3. Idem avec 3b dans la 1° urne et 1b+4n dans la 2°. 
4 Comment Ali Baba maximise-t-il ses chances ? 


1.18 


Les assistants sociaux travaillant pour une clinique psychiatrique sont si 
occupés qu’en moyenne seuls 60 % des patients prospectifs téléphonant pour 
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la 1° fois obtiendront une communication avec l’un de ces assistants. On de- 
mande aux autres de laisser leur numéro de téléphone. Trois fois sur 4 un 
assistant trouve le temps de rappeler le jour même, autrement le rappel a lieu 
le lendemain. L'expérience à montré que, dans cette clinique, la probabilité que 
le patient prospectif demande une consultation est de 0,8 s’il a pu parler im- 
médiatement à un assistant, tandis qu’elle tombe à 0,6 et 0,4 respectivement 
s’il y a eu rappel du patient le jour même ou le lendemain. 

1. Quel pourcentage des patients qui appellent demande une consultation ? 

2. Quel pourcentage des patients en consultation n’a pas eu à attendre qu’on 

les rappelle ? 


1.19 


On a à disposition 2 tests sanguins pour le dépistage du HIV : d’une part 
V'ELISA, relativement bon marché (environ 20 €) et raisonnablement fiable, 
et d’autre part le Western Blot (WB), nettement meilleur mais beaucoup plus 
cher (environ 100 €). 

Un patient vient vers vous, un médecin, avec des symptômes vous suggérant 
qu’il peut être HIV-positif. Pour ce patient, le prévalence du HIV est estimée 
par la littérature médicale à P(A) = P(il est HIV-positif ) — 0,01. Les données 
concernant des personnes dont on connaît le statut HIV apportent : 

P(ELISA positif | HIV-positif) — 0,95 ; 

P(ELISA négatif | HIV-négatif) — 0,98. 

En utilisant le théorème de Bayes, calculer : 

P(HIV-positif | ELISA négatif) et P(HIV-négatif | ELISA positif). 
Quelle(s) conséquence(s) peut-on en tirer sur l’utilisation de l’'ELISA ? 


1.20 


L'hôpital de Jujuy, petite ville du Nord-Ouest de l’Argentine, compte parmi 
ses malades 4 % qui sont d’origine basque, 58 % d’origine espagnole, 32 % 
d’origine indienne et 6 % d’origine italienne. Sachant que 3 % des Indiens ont 
un sang de rhésus négatif, ainsi que 87 % des Basques et 22 % des populations 
d’origine latine, quelle est la probabilité pour qu’une éprouvette de sang de 
rhésus négatif provienne d’un malade d’origine basque ? 


1.21 


Depuis Genève (GVA) où il habite, Serge veut se rendre à Dublin (DUB) 
pour assister à un concert de U2. $S’y étant pris un peu tard, tous les avions pour 
aller en Irlande sont presque pleins. Trois itinéraires différents et équiprobables 
s’offrent à lui : passer par Bruxelles (BRU), Munich (MUC) ou Francfort (FRA). 


8 Maitriser l’aléatoire 


Nadine, qui est hôtesse d’accueil à l’aéroport, à une bonne expérience et fait 
l'estimation suivante : 

— la correspondance partant de BRU a une probabilité de 1/5 d’être pleine: 

— celle partant de MUC, une probabilité de 1/4; 

— celle partant de FRA, une probabilité de 1/2. 
Il existe encore une possibilité supplémentaire. Si Serge décide de passer par 
FRA (et la liaison FRA-DUB est complète), il aura le temps de prendre un 
train rapide qui l’amènera à MUC à temps pour prendre le vol MUC-DUB (à 
condition qu’une place soit disponible dans l’avion, bien entendu). 

Cinq jours plus tard, Serge rencontre David et lui témoigne le plaisir qu’il 
a eu de pouvoir assister au concert de U2. Quelle est la probabilité qu’il soit 
passé par MUC? 


1.22 


Le petit David est très friand de bonbons; il en a toujours quelques-uns 
dans les poches. Manquant d’esprit de décision quant à l’arôme qu’il préfère, 
il procède au jeu suivant. Dans sa poche gauche, il met 5 bonbons à l’orange 
et 3 à la fraise et, dans la droite, il en met 4 à l'orange et 2 à la fraise. Il tire 
ensuite une pièce et si elle donne pile, il pioche à gauche et si elle donne face, 
il se sert à droite. La pièce est bien sûr parfaitement équilibrée. 

1. Quelle est la probabilité qu'après 2 jets, il ait mangé 2 bonbons ayant le 

même parfum ? 

2. Il rentre ensuite chez lui et vide ses poches sur une table. Sa mère, au 
courant du jeu de son fils, trouve sur la table 7 bonbons à l’orange et 
5 à la fraise. Aidez-la à trouver la séquence des 2 jets de pièce la plus 
probable qu’a eue David. 

3. Le lendemain, David n’a plus que des bonbons à l’orange. Il en met 5 à 
gauche et 2 à droite. Il passe chez l’épicier pour en acheter à la fraise. 
Sachant qu’il les mettra tous dans la poche droite, combien doit-il en 
acheter pour qu’au prochain jet, il soit le plus près possible d’avoir autant 
de chances d’en tirer un à l’orange ou à la fraise? 


1.23 


Un tribunal de 3 juges déclare un individu coupable lorsque 2 au moins des 
3 juges estiment que cette décision est fondée. On admettra que si l’accusé est 
effectivement coupable, chaque juge se prononcera dans ce sens avec probabi- 
lité 0,7, ceci indépendamment des 2 autres. Cette probabilité tombe à 0,2 dans 
le cas où l’accusé est innocent. 70 % des accusés sont coupables. Calculer la 
probabilité que le juge 3 vote coupable dans chacune des situations suivantes : 

1. les juges 1 et 2 l’ont fait; 

2. le juge 1 a voté coupable ou le juge 2 a voté coupable; 
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3. les juges 1 et 2 ont voté tous deux non coupables. 


1.24 


Freddy fait une sauce au vin que le monde entier vient goûter. Comme elle 
est très délicate, il la rate 1 fois sur 10 s’il utilise du Bordeaux ou du Bourgogne 
et 1 fois sur 5 avec du Côtes-du-Rhône. Dans sa cuisine, Freddy a une bouteille 
ouverte dont il a perdu l’étiquette. Connaissant la proportion de ces 3 vins 
dans sa cave, il estime que les chances que cette bouteille soit un Bordeaux, 
un Bourgogne ou un Côtes-du-Rhône sont respectivement 40 %, 30 % et 30 %. 
Freddy utilise cette bouteille pour faire sa sauce et la rate. Quelles doivent être 
ses nouvelles estimations sur la provenance de la bouteille ? 
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Corrigés 
Le 


On numérote les chapeaux 1,2,3 et 4. Il y a 4! — 24 issues possibles w1 = 
(1,2,3,4), w2 = (1,2,4,3),..., où w1, ..., W24 sont les issues possibles. 


1. On compte les issues favorables, à savoir celles qui n’ont ni le 1 en 1° po- 


sition, ni le 2 en 2°, ni le 3 en 3°, ni le 4 en 4°. On dénombre alors 9 issues 


favorables. La probabilité est donc de Ÿ = à. 


2. On procède de la même manière en choisissant comme issues favorables 
celles qui ont exactement 2 chapeaux placés au bon endroit. On en dé- 
nombre 6 et la probabilité est de nu = +. 


Ée 


Avec 2 dés de 6 faces, il y a 36 issues possibles. Aurélie marque 1 point si 
les dés montrent une des 8 combinaisons suivantes 


(2,3), (6,1) , (2,5), (4,3), (3,2) , (L,6) , (5,2) ou (3,4). 
Nicolas marque 1 point si les dés donnent 

(2,2), (4,1), (5,1), (4,2), (3,3), (2,4), (1,5) ou (1,4), 
soit 8 issues favorables également. Donc 


8 2 
P(Aurélie marque 1 point) = P(Nicolas marque 1 point) = 20 0: 


Les probabilités de marquer 1 point sont égales. 


1.3 


Soient F l'événement « avoir une fille » et G l'événement « avoir un garçon ». 
Il y a 2% — 16 issues possibles pour une famille de 4 enfants. On dénombre 
6 issues « avoir 2 filles et 2 garçons »: 


(GGFF),(GFGF),(GFFG) ,(FGGF) ,(FGFG), (FFGG), 


et la probabilité cherchée est & _ à. Il y a donc moins de familles bien réparties 
avec 4 enfants. 
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n3 


Le nombre d’issues possibles lorsqu'on tire 2 cartes parmi 52 est C2. Le 
nombre d’issues favorables « (un 10 OÙ un valet OÙ une dame OÙ un roi) ET 


un as » est Cf: C16. Ainsi 
4 16 
1 1 32 


P(blackjack) = | ( = = 
?) 


1,9 


Soit X le rang de la meilleure femme. La probabilité d’avoir X = 1 est 
1 
P(X = 1) = P(femme en premier) = P(F...) = 3 
La probabilité d’avoir X = 2 correspond à la probabilité qu’un homme soit 1° 
et une femme 2°: 


1 
P(X =2) = P(HF = ie 
On continue de la même manière 
1 4 5 5 

P(X =3) — RE: 
P(X =4) — Hi os r 
P(X =5) — ERP AUREZ 
P(X =6) — PCHHHHHF...)= 25:27 5 5-3 


Finalement, la meilleure femme ne pouvant être classée au-delà de la 6° place, 
P(X =7) = P(X =8) = P(X —9) = P(X = 10) = 0. 


1.6 


Soient les événements À « obtenir au moins 1 as en lançant 4 fois un dé » 
et B « obtenir au moins une paire d’as en lançant 24 fois 2 dés ». Ainsi 


et 


L'événement le plus probable est A. 
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Cu 
AR 


Fig. 1.1 — Diagramme de l'exercice 1.7. 


1,7 


Soient 3 événements À, B et C. 

1. Dans le dessin des ensembles de la figure 1.1, W, X, ŸY et Z sont des 

surfaces qui représentent P(AN B) par W + X, P(ANC) par X +Y et 
P(BNC) par X +Z. 
Pour le calcul de P(AU BU C), on commence par additionner les proba- 
bilités P(A), P(B) et P(C). En procédant de la sorte, on a compté une 
fois de trop les aires W+X,Y +X et Z + X qu'il faut donc soustraire. 
Finalement, la surface X a été additionnée 3 fois, puis soustraite 3 fois 
également. Pour arriver au résultat final, il faut, par conséquent, l’ajouter 
encore une fois. Ainsi 


P(AUBUC) = 
= P(A)+P(B)+P(C) - P(ANB) - P(ANC) - P(BNC) 
+P(AN BNC). 


2. Par les axiomes de la théorie des probabilités, on obtient le même résultat 


= P(AUB)+ P(C)- P((AUB)nC) 


=  P(A) + P(B) - P(ANB)+ P(C) - P(ANC)U(BNC)) 
=  P(A) + P(B) + P(C) - P(ANB) - P(ANC) - P(BNC) 
+P(AN BNC) 


1. Probabilités élémentaires 13 


Le 


Soient F l'événement « avoir une fille » et G l’événement « avoir un garçon ». 
Dans une famille avec 2 enfants, il y a 4 issues possibles 


(CG; GF.FG, FF). 


1. On cherche 


P(GG) Pr 
HORS ee rare à 


2. Cette fois, 
1 
P(GG| GFU FGU GG) = 3 


1.9 


Soient « Z » l'événement « les 2 dés donnent des résultats différents » et S 
la variable aléatoire « somme des 2 dés ». 


1. 
_ P(6NZ) 10/36 1 
PE = ED — 30/86 5 
2; 
P(6 sn 0 i = 1,2,3,4,5,6 
P(6 S=7=3 
P(6 s-8)-€ 
P(6 s=9-; 
P(6 S = 10)= 2 
P(6|S=11)=1 
P(6|S=12)=1 
P(6|S=i)=0 ài>12 
1.10 


Soit À (respectivement B, C', D et E) l'événement « la panne provient de 
la composante À (respectivement B, C', D et E) ». 

1. : 
— _ P(BNA) 
_ PA) 
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Puisque B C A 


P(BNAÀ) P(B) 0,3 30 te 
P(A) 1-—P(4) 1-035 65 
2. Par le même raisonnement, (C U D) € (AU B). De plus, les pannes ne 
peuvent pas être simultanées ce qui implique que tous les événements sont 
indépendants. Ainsi 
P(CUD) P(C) + P(D) _ 30 


FPT 


Soit À (respectivement B et C) l'événement « l'employé travaille dans l’en- 
trepôt À » (respectivement B et ©) et F l'événement « l'employé est une 
femme ». On trouve alors 

P(F | C)P(C) 
P(F | A)P(A)+P(F|B)P(B) + P(F|C)P(C) 
0,72 


1 
O5 +0,62 +0,72 2. 


P(CTF) 


F2 


Soit F (respectivement R et H) l'événement « R. Federer (respectivement 
À. Roddick et L. Hewitt) gagne le tournoi ». On cherche P(R | F). De 


P(R) = P(R|F)P(F)+P(R|F)P(F), 


on déduit 
P(R) - P(R| F)P(F) _ 3/10 —0-4/10 DU 


RS En 7 6/10 2 


De la même manière, on trouve 
= 1 
P(H|F)=—. 
3 
Le 


Soient P À l'événement « Mme Parisod a une fille » et GL l’événement « le 
docteur Gluck a prévu une fille ». On trouve 
P(GL | PA)P(PA) 
P(GL | PA)P(PA) + P(GL| PA)P(PÀ) 
19/20 : 1/2 19 
19/20:1/24 1/10 102 2. 


P(PA|GL) 


0,91. 
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nr 


Soient À l'événement « avoir 1 accident ou plus » et B1 (respectivement B2 
et B3) l'événement « appartenir à la catégorie bas (respectivement moyen et 
haut) risque ». 


1. 
P(4) = P(A|B)P(B1)+ P(A| B:)P(B2) + P(A | B3)P(B3) 
= 0,05:0,2+ 0,15 - 0,5 + 0,3 - 0,3 = 0,175. 
: (| B)P(B) 
_  P(A|B:)P(B:) 0,95-0,2 
PB À) = 2% = 2% 0,28, 
CAES P(A) 0825 0 
1.15 


Soient E; l’événement « l’avion est dans la région 4 » et M; l'événement 
« on ne trouve pas l’avion dans la région 4 », avec à = 1,2,3. On sait que 


P(E)== et P(M|E)=a, i=1,2,8. 


On cherche les probabilités que l’avion se trouve dans une des 3 régions en 
sachant que les recherches dans la zone 1 n’ont rien donné 


P(E;)-P(M | E -1/3 
PE jh RER. RS 
Di PME). P(Ei) œ:1/3+1/3+1/3 œ +2 
Dans ce calcul, on a tenu compte du fait qu’il est certain de ne pas trouver 
l’avion dans la zone 1 si ce dernier se trouve en réalité dans les zones 2 ou 3 
(P(M | E2) = P(M | E3) = 1). On procède de la même manière pour 
P(E2) : P(M: | E2) 1 


RE Om enr de 0 


1.16 


Soient les événements W — « la météo prévoit la pluie », R=K il pleut » et 
U = « Mr. Pickwick prend son parapluie ». On sait que P(R) = 1/2. De plus, 
on peut dessiner l’arbre de la figure 1.2, avec lequel on calcule 


1. 


_ PIUNR) --1/2:1/8-2/8..:2 
AO CURE 
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Fig. 1.2 — Arbre de l’exercice 1.16. 


_ P(RNU) _1/2-2/3-1/3+1/2-1/3-1 5 
POUND Dan ee 25 _ 1 
1.17 


Soient les événements U1 (U2) « Ali Baba tire dans la 1° (2°) urne » et S 
« Ali Baba a la vie sauve ». Dans tous les cas suivants, on aura 


P(S) = P(S [U1)P(U:) + P(S | U2)P(U2). 


1. Quatre boules blanches sont placées dans UÜ; et 4 noires dans U2 
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2. Deux boules blanches et 2 boules noires sont placées dans chacune des 


2 urnes \i Vi 1 
FI 5522 5; 
3. Trois boules blanches sont placées dans U, et le reste dans ÜU2 
1 11 3 
P = dl =+=-——; 
(5) 2 52 5° 


4. Ali Baba maximise ses chances de rester en vie en plaçant 1 boule blanche 
dans la 1° urne et toutes les autres dans la 2° 


110 


Soient les événements À « le patient demande une consultation » et B1 
(respectivement B2 et B3) « le patient obtient immédiatement (respectivement 
le soir même et le lendemain) un entretien téléphonique ». 

1. Le pourcentage des patients demandant une consultation parmi ceux qui 

appellent est 
3 
P(A) = ÿ_P(A | Bi)P(B:) = 
i=1 


= 0,8:0,6+ 0,6: 0,4: 0,75 + 0,4 : 0,4 : 0,25 = 0,7 = 70 %. 


2. Le pourcentage des patients en consultation qui n’ont pas eu à attendre 
d’être rappelés est 
P(A]|B:)P(B:) 0,8-0,6 


1.19 


Soient les événements HIV* (respectivement HIV—) « le patient est HIV- 
positif (respectivement négatif) » et ET (respectivement ET) « l'ELISA est 
positif (respectivement négatif) ». On trouve 


P(E- | HIV+)P(HIV+) 


PAVTE) = ——— 
Ds P(E-| HIV )P(HIVS)+P(E | HIV-)P(HIV ) 
0,05 : 0,01 : 
— 005-0014 0,98-0,09 — 005 % 
et 
P(E*T | HIV-)P(HIV- 


P(E+| HIV+)P(HIV+)+P(E+ | HIV-)P(HIV-) 


0,02 - 0,99 = 
— 002-0994 0,95-0,01 — "08. 
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Fig. 1.3 — Arbre de l'exercice 1.21. 


Au vu de ces résultats, il est évident que l’'ELISA est un très bon test pour 
déterminer si un patient n’est pas HIV-positif. Par contre, il est inefficace pour 
décider de la contamination d’un patient. Dans l’exercice 2.1, un autre test est 
utilisé pour déterminer si un patient est vraiment malade. 


1.20 


Soient les événements B (respectivement Z et L) « le malade est d’origine 
basque (respectivement indienne et latine) » et RH (respectivement RH”) 
« le sang contenu dans une éprouvette est de rhésus positif (respectivement 
négatif) ». On cherche la probabilité que le sang de rhésus négatif contenu 
dans une éprouvette provienne d’un malade d’origine basque : 


P(RH- | B)P(B) 
P(RH-) 
0,97 : 0,04 


à 
0,87-0,04+0,03-0,32+0,22-0,64 


P(B|RH°) 


A 


Soient les événements BRU (respectivement MUC et FRA) « Serge passe 
par Bruxelles (respectivement Munich et Francfort) » et P l'événement « Serge 
ne peut pas partir car l’avion est plein ». On construit l’arbre de la figure 1.3 
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4 


PTT 


4 


_ 


_ 


Fig. 1.4 — Arbre de l'exercice 1.22. 


pour trouver 


P(MUC|P) = TE — 
: 1/3-3/4+1/3-1/2-3/4 
-__ 1/3-4/5+1/3-3/4+1/3.:1/2:3/4+1/3:1/2 
45 
= 97 — 0,46 
74 


Soient les événements P « la pièce donne pile » et © « le bonbon tiré est 
à l’orange ». Au départ, David a 5 bonbons à l’orange et 3 à la fraise dans la 
poche gauche (50 +30) et 4 à l'orange et 2 à la fraise dans la droite (40 +20). 
On construit l’arbre de la figure 1.4 en faisant attention au fait que les 
tirages sont sans remise; ce qui implique que les probabilités changent au fur 
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et à mesure des événements. 
1. La probabilité de tirer 2 bonbons ayant le même parfum est alors 


P(2 parfums identiques) = 
_ 1 (8428484044 re+ gs) & 0.50 
4A\87 83 87 83 38 35 38 35 DR 
2. Il reste 7 bonbons à l’orange et 5 à la fraise. Cela signifie que David a 
tiré 2 bonbons à l’orange. Pour trouver la séquence la plus probable, on 
calcule la probabilité pour chacune des quatre séquences possibles 


P(OO|PP)P(PP) _ 5/8-4/7-1/4 


P(PP|00) = PIO0) © 023 
P(PP|00) = IS SIENS = 0,26 
P(PP|O00) = PIS SIENS = 0,26 
P(PP|00) = ISSU = 0,25 
.. 1/54 52 23 25 
P(00) = 1 EE + 33 + 35 + +) = 0,40. 


Les 2 séquences les plus probables sont PP et PP (elles sont équivalentes). 


3. Soit X le nombre de bonbons à la fraise que David doit acheter. On veut 
que P(O) = 1/2 


P(O) = P(O | P)P(P)+ P(O | P)P(P) =1: 


Il faudrait que David achète une infinité de bonbons pour équilibrer les 
chances de tirer un bonbon à l'orange ou à la fraise. 


1:28 


Soient les événements JC; « le juge à vote coupable » (à = 1,2,3) et C 
« l'accusé est effectivement coupable ». 
1. On cherche d’abord la probabilité que le 3° juge vote coupable en sachant 
que les 2 premiers votent coupable 


PIC: M ICiNTGS) 


PRÉ IGNIOUE nre 
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Il faut faire attention de ne pas utiliser l’indépendance dans cette équation 
directement. Il y a seulement indépendance entre les décisions des juges 
conditionnées à la culpabilité (ou non culpabilité) de l’accusé. Aïnsi, il est 
nécessaire de faire apparaître des probabilités conditionnelles pour utiliser 
l'hypothèse d'indépendance : 
P(JC3 | JCi1N JC2) = 
__ PUCGNJCiN JC | C)P(C) + P(JC3 N JC N JC2 | C)P(C) 
E P(JCi N JC» | C)P(C) + P(JCi N JC | C)P(C) 
P(JGs | C):P(JG]0C):P(JC1C):P(C) 
P(JCi | ©): P(JC2 | C)- P(C) + -P(JC | C) + P(JC2 | C) + P(C) 
PJCS | Che POGlOPOCG.|' PC) 
P(JCi | ©): P(JC2 | C) + P(C) + -P(JC | C) + P(JC2 | C) + P(C) 
3. de 3. 
. 0,7° -0,7 +0,2° - 0,3 : 97 = 0,68. 
0,72-0,7+0,22-0,3 142 


2. Le raisonnement pour les 2 dernières questions est le même qu’en 1. 


P(JC3 | JC1 N JC?) = 


+ 


__ P(JC3NJCNJC) _ 0,72-0,3-0,7+0,22-0,8-0,3 | bée 
: P(JCiNJC) 0,7-0,3-0,7+0,2-0,8-03 
3. 
P(JG3 | JC N JC) = 
P(JC3NJC: N IC?) _ 0,7-0,32-0,7+0,2-0,82-0,3 _—. 
PJGNIC) 0,32 - 0,7 + 0,82 - 0,3 Nr 
1.24 


Soient les événements À « la sauce est ratée » et C'R (respectivement BD 
et BG) « la bouteille est du Côtes-du-Rhône (respectivement du Bordeaux et 
du Bourgogne) ». On commence par calculer la probabilité que le vin soit du 
Bordeaux en sachant que la sauce est ratée: 

P(R| BD)P(BD) 
P(R| BD)P(BD) + P(R| BG)P(BG) + P(R| CR)P(CR) 
0,1: 0,4 4 
= —————— = — © 0,31. 
0,1-0,4+0,1-0,3+0,2-0,3 13 


On procède de la même manière pour les 2 autres vins et on trouve 


P(BD|R) = 


3 6 
P(BG|R)=- 023 et P(CR|R)= 2 +046. 


Aïnsi, en sachant que la sauce a raté, la bouteille a environ 31 % de chance 
d’être du Bordeaux, 23 % d’être du Bourgogne et 46 % d’être du Côtes-du- 
Rhône. 


Chapitre 2 


Variables aléatoires 
discrètes 


Introduction 


La notion de variable aléatoire est fondamentale dans le calcul des proba- 
bilités. La première partie de ce chapitre présente des exercices sur les outils 
généraux de travail avec des variables aléatoires discrètes. Ceux-ci incluent la 
loi de probabilité, la fonction de répartition, l'espérance et la variance (exer- 
cices 2.1 à 2.4). Ensuite on a recueilli les exercices concernant quelques lois 
discrètes de probabilité. On traite en particulier les deux lois discrètes les plus 
importantes, à savoir la loi binomiale et la loi de Poisson (exercices 2.5 à 2.18). 


La loi binomiale 


La structure qui génère la loi binomiale peut être résumée de la façon sui- 
vante. Considérons une expérience aléatoire constituée de n épreuves indépen- 
dantes. À chaque épreuve deux issues sont possibles, « succès » avec probabi- 
lité p et « échec » avec probabilité 1 — p. La variable aléatoire X qui compte 
le nombre de « succès » dans la série de n épreuves suit une loi binomiale avec 
paramètres n et p, X = Bin(n,p), c’est-à-dire 


P(X = k) = ( “ jou ps k=1,...n. 


On a E(X) = np et var(X) = np(1 — p). 

Cette structure est importante car elle se retrouve dans de nombreuses 
situations différentes, comme par exemple le contrôle de qualité, la modélisation 
en temps discret du prix d’un actif financier et les prévisions dans le cadre d’un 
sondage avant une votation. 
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La loi de Poisson 


La loi de Poisson peut être vue comme un cas limite de la loi binomiale 
quand n — co, p — Ü, et np — À = const. Ceci modélise la situation avec 
un grand nombre d'épreuves (individus, objets ...) et une petite probabilité p 
d'obtenir un « succès » à chaque épreuve. La loi de Poisson est utilisée pour 
modéliser par exemple le nombre de clients qui arrivent à un guichet, le nombre 
de pannes d’une machine, ou le nombres d’accidents de la circulation pendant 
une certaine période. La loi de probabilité de Poisson d’une variable aléatoire X, 
X © P(À), À > 0, s'écrit 


On a E(X) = var(X) = À. 


Notes historiques 

Le cas spécial n — 1 de la loi binomiale est appelé la loi de Bernoulli (du nom 
du mathématicien suisse Jacques Bernoulli). La loi de Poisson fut introduite 
en 1837 par Siméon Denis Poisson et utilisée ensuite en 1898 par Bortkewitz 
pour modéliser « le nombre de soldats tués par ruades de cheval dans l’armée 
prussienne pendant 20 ans ». 


Références (théorie) 


Ross, chapitres 4 et 7 [1] et Pitman, chapitres 2 et 3 [2]. 
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Exercices 
Moments et probabilités 


2.1 (Suite de l’exercice 1.19) 


On note: 
c1 = coût du test ELISA = 20 €; 
c2 = coût du test WB — 100 €; 
Ly = coût supplémentaire engendré par le faux diagnostic : conclure que le pa- 
tient est HIV-négatif alors qu’il est HIV-positif — 1 000 000 €; 
Lyr = coût supplémentaire engendré par le faux diagnostic: conclure que le 
patient est HIV-positif alors qu’il est HIV-négatif — 1 000 €. 


La 1° stratégie est la suivante: on fait le test de l’'ELISA. S'il est négatif, 
on considère que le patient est HIV-négatif. Sinon qu’il est HIV-positif. 


Une 2° stratégie est comme la 1°, sauf que si PELISA est positif, on fait en 
plus le WB. Si ce dernier est positif, on considère que le patient est HIV-positif, 
sinon qu'il est HIV-négatif. 


On formalise la 2° stratégie ainsi 
— les issues possibles sont composées de triplets (statut HIV, statut ELISA, 
statut WB). Par exemple, on considère (+, + +); 
— une probabilité associée à chaque issue. Pour (+, + ,+) c’est 0,00945 ; 


— à chaque issue est associée une valeur, définissant ainsi une variable aléa- 
toire U, appelée utilité. Pour (+, + ,+), c’est —c1 — c2 = —120 €. Pour 
(+,— ,—), c’est —c1 — Ly — —1 000 020 €. 


1. Compléter le tableau suivant résumant la 2° stratégie. 


— C1 — C2 
—@ — C2 — Li 
—@ — Lr 
—Q — Lr 


—C1 — C2 — Li 


—C] 


2. Calculer l’espérance de l’utilité. 
3. Pour la 1"° stratégie, faire de même (tableau et espérance de l’utilité). 
4. Quelle stratégie faut-il adopter? (Discuter en fonction de Lr et Lrr.) 
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2.2 


Vous vous promenez en forêt et vous tombez nez-à-nez avec un ours af- 
famé. Heureusement, vous ne sortez jamais sans votre fusil, mais vous n’avez 
cependant que 3 cartouches en poche. Sachant qu’à chaque tir, vous avez une 
probabilité p d'atteindre votre objectif, c’est-à-dire de tuer l’ours, et en notant 
X la variable aléatoire représentant le nombre de tirs strictement nécessaires 
pour tuer l’ours, répondez aux questions suivantes. 


1. Calculez P(X = 1), P(X = 2), et P(X = 3) en fonction de p. 

2. Donnez également P(X < 3). Que représente cette probabilité? 

3. Sachant que E(X) = 1/p, quelle est la valeur minimale de p pour espérer 
sortir vivant de ce mauvais pas ? 

4. En réalité, l’angoisse et le stress diminuent vos aptitudes au tir si bien que 
la probabilité d'atteindre l’ours au 4° essai est donnée par p°. Donnez dans 
ce cas P(X = 1), P(X = 2) et P(X = 3) et comparez ces probabilités 
avec celles obtenues au point 1. 


2.3 


Une personne possède 4 clefs parmi lesquelles une seule ouvre la porte. Elle 
les essaie au hasard en éliminant celles qui ne marchent pas. On pose X « le 
nombre d’essais pour ouvrir la porte ». 

1. Calculer la loi de probabilité de X, c’est-à-dire P(X = k) avec k = 

1,2,3,4. 

2. Calculer E(X) et Var(X). 


2.4 


Le fisc répartit les ménages en 5 classes de revenu. Les données de l’année 
fiscale 2005 lui apportent : 
Classe 1 : 19 000 ménages. 
Classe 2 : 45 000 ménages. 
Classe 3 : 28 000 ménages. 
Classe 4: 9 000 ménages. 
Classe 5 : 2 000 ménages. 


Notons X la variable aléatoire « classe d'appartenance ». 
1. Trouver la fonction de répartition de X. 
2. Calculer P(2 < X < 4) et P(X > 4). 
3. Calculer E(X) et Var(X). 
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2.5 


Un canal de transmission d’information ne peut traiter que des 0 et des 1. À 
cause de perturbations dues à l'électricité statique chaque chiffre transmis l’est 
avec une probabilité d’erreur de 0,2. Admettons que l’on veuille transmettre 
un message important limité à un signal binaire. Pour éviter une erreur on 
transmettra 00000 au lieu de 0 et 11111 au lieu de 1. Si le récepteur décode 
suivant la règle de la majorité, quelle est la probabilité que le message soit mal 
interprété ? 


2.6 


Un épicier reçoit un lot de pommes dont 25 % sont avariés. Il charge un 
employé de préparer des emballages de 5 pommes chacun. Celui-ci, négligent, ne 
se donne pas la peine de jeter les fruits avariés. Chaque client qui trouve, dans 
l'emballage qu’il achète, 2 fruits ou plus qui sont avariés, revient au magasin se 
plaindre. 

1. Soit X le « nombre de pommes avariées dans un emballage ». Déterminer 

la loi de probabilité de X. 

2. Quelle est la probabilité pour qu’un client donné se plaigne auprès de son 

épicier ? 

3. Si l’épicier a 100 clients qui achètent des pommes ce jour-là, combien y 

aura-t-il de plaintes? 


2.7 


Giovanni, dit Gianni, a décidé de parcourir cet été 10 000 km en Fiat Ritmo. 
Or la probabilité d’avoir un accident sur 1 km est de 1/10 000. En prenant 
connaissance de cette probabilité, Gianni décide alors d'annuler son long voyage 
en prétextant d’être sûr d’avoir un accident. Êtes-vous d’accord avec Gianni? 
Si ce n’est pas le cas, quelle est l’erreur commise par notre ami Gianni? Quelle 
est alors approximativement la probabilité que Gianni ait un accident ? 


2.8 


Un journaliste se voit remettre une liste de personnes à interviewer. Il doit 
interroger 5 personnes au moins. Les interviewés potentiels n’acceptent de par- 
ler qu'avec une probabilité de 2/3, indépendamment les uns des autres. Quelle 
est la probabilité qu’il puisse réaliser ses 5 entretiens si la liste compte 5 noms? 
Et si elle en compte 8? 


28 Maîtriser l’aléatoire 


2.9 


Des études effectuées par les compagnies aériennes montrent qu’il y a une 
probabilité de 0,05 que chaque passager ayant fait une réservation n’effectue 
pas le vol. À la suite de ça, SA Airlines vend toujours 94 billets pour ses avions 
à 90 sièges, tandis que BA Aiïrlines vend toujours 188 billets pour ses avions à 
180 sièges. Avec quelle compagnie un passager ayant réservé un siège risque-t-il 
le plus de ne pas pouvoir prendre place dans l’avion ? 


2.10 


Madame Gourmande prépare des biscuits aux raisins secs et aux pépites de 
chocolat. Elle mélange 600 raisins et 400 pépites de chocolat dans la pâte et 
prépare 500 biscuits. Dès que les biscuits sont prêts, Madame Gourmande en 
choisit un au hasard pour le goûter. 


1. Calculer la probabilité qu’il n’y ait pas de raisins dans le biscuit. 

2. Calculer la probabilité qu’il y ait exactement 2 pépites de chocolat. 

3. Calculer la probabilité qu’il y ait au moins 2 morceaux (raisins ou pépites 
de chocolat). 


2.11 


1. Nadine part à la cueillette des champignons. Elle ne sait pas faire la 
différence entre un champignon comestible et un champignon toxique. 
On estime que la proportion de champignons toxiques se trouvant dans 
les bois s’élève à 0,7. 

(a) Nadine ramasse 6 champignons au hasard. Calculer la probabilité 
qu’elle ramasse exactement 4 champignons toxiques. 

(b) Nadine invite Serge à une cueillette. Serge connaît bien les cham- 
pignons; sur 10 champignons qu’il ramasse, 9 sont comestibles. Ce 
jour-là, il ramasse 4 champignons et Nadine en ramasse 3. Calculer 
la probabilité que tous les champignons soient comestibles. 

2. Serge cueille en moyenne 12 champignons par heure. 

(a) Calculer la probabilité qu’il ramasse exactement 8 champignons en 
une heure. 

(b) Calculer la probabilité qu’il ramasse au moins 1 champignon en 
20 minutes. 


2.12 


Les ingénieurs du son préposés à la sonorisation d’un concert en plein air 
hésitent entre deux solutions : 4 haut-parleurs de 4 000 watts chacun ou 2 haut- 
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parleurs de 8 000 watts chacun. On suppose que la probabilité qu’un haut- 
parleur tombe en panne est égale à p = 0,2 indépendamment du type de haut- 
parleur et que les pannes se produisent indépendamment les unes des autres. 
En admettant que le concert peut se dérouler avec au moins 8 000 watts, quelle 
solution conseillerez-vous à ces ingénieurs ? 


Exercices combinés 


2.13 


Dix chasseurs guettent le passage d’un vol de canards. Lorsque les canards 
passent en groupe, les chasseurs font tous feu en même temps mais chacun 
choisit sa cible au hasard indépendamment des autres. On admet que chaque 
chasseur touche son canard avec la même probabilité p. 

1. Combien de canards, en moyenne, survivront au tir lorsque le vol se com- 

pose de 20 canards? Calculer cette moyenne pour diverses valeurs de p. 

2. Quel sera le nombre de canards touchés si le vol se compose d’un nombre 

de canards suivant une loi de Poisson de paramètre 157? 


2.14 


Chacun des soldats d’une troupe de 500 hommes est porteur d’une certaine 
maladie avec probabilité 1/1 000. Cette maladie est détectable à l’aide d’un 
test sanguin et, pour faciliter les choses, on ne teste qu’un mélange du sang des 
500 soldats. 

1. Quelle est la probabilité que le test soit positif, indiquant par là qu’au 

moins une des personnes est malade ? 

2. On suppose que le test a été positif. Quelle est la probabilité que dans ce 

cas, plus d’une personne soit malade ? 


2.15 


À l’université, le taux de blocage de mâchoire provoqué par un bâillement 
profond est de 1 personne pour 1 000 et par mois. On suppose qu’un étudiant a 
au plus un blocage de mâchoire par mois et que les blocages de mâchoire sont 
indépendants. 

1. Quelle est la probabilité qu’en un mois de l’année académique 2005-2006 

il y ait 3 blocages de mâchoire ou plus parmi les étudiants de l’université ? 
Indication : supposer qu’il y à 4 000 étudiants. 

2. Quelle est la probabilité qu’au cours de l’année académique 2005-2006 le 

nombre de mois comptant 3 blocages de mâchoire ou plus soit supérieur 
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ou égal à 4? 

Indication : supposer qu’une année académique est constituée de 8 mois. 
3. Le premier mois de l’année académique étant appelé mois 1, quelle est la 

probabilité que le premier mois où l’on enregistre 3 blocages de mâchoire 

ou plus soit le mois 4, à = 1,2,...,87? 


2.16 


Un jeux de dés très populaires dans les bars anglais est le chuck-a-luck. Il 
consiste pour la banque à jeter 3 dés. Un joueur peut parier sur n’importe quel 
résultat compris entre 1 et 6. Si exactement un de ces 3 dés montre le chiffre 
prévu, le joueur récupère sa mise plus un montant équivalent. Si 2 dés montrent 
ce résultat, le gain net est de 2 pour 1; si les 3 dés indiquent le chiffre prévu, le 
gain net est de 3 pour 1. Si aucun dé ne montre le chiffre choisi par le joueur, 
ce dernier perd sa mise. 

1. Calculer l'espérance de gain lorsque l’enjeu est d’une livre. 

2. Quel montant devrait recevoir le joueur si les 3 dés montrent le chiffre 

prévu pour que le jeu soit fair (c'est-à-dire pour que l’espérance de gain 
soit nulle) ? 


2.17 


On observe l’arrivée de personnes à un guichet, 2 personnes ne pouvant 
arriver en même temps. Le nombre d’arrivées dans un intervalle de temps de 
longueur t est une variable aléatoire N(t) distribuée selon une loi de Poisson de 
paramètre Àt. Les arrivées se produisent indépendamment les unes des autres. 
On choisit un temps to = 0. Soit 7% la variable aléatoire qui représente l’arrivée 
du k° client à partir de to. 
1. Quelle est la loi de T' ? 
Indication : la probabilité que T\ soit supérieur à t est égale à la probabilité 
que personne n'arrive dans l'intervalle [0, t]. 

2. Calculer la fonction de répartition de 7%. 

3. Calculer la densité de 7%. De quelle loi s'agit-il? 


2.18 


Andi va skier et emprunte une des N perches d’un remonte-pente. Entre cet 
instant et la prochaine remontée, le nombre de skieurs qui se présentent suit 
une loi géométrique de paramètre p. 

Quelle est la probabilité pour Andi de reprendre la même perche? 
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2.19 (Loi géométrique ou loi de Pascal) 


On considère une série d'épreuves indépendantes. À chaque épreuve, on 
observe un « succès » avec probabilité p et un « échec » avec probabilité 1 — p. 
Soit X la variable aléatoire discrète suivante : 

X = nombre d'épreuves nécessaires pour obtenir le 1° « succès ». 


1. Calculer la loi de probabilité de X, c’est-à-dire P(X = k), k € N. Cette 
loi est dite loi géométrique. 

2. Vérifier que E(X) = 1/p. 

3. Vérifier la propriété « sans mémoire » de la loi géométrique 


P(X>kIX>j)=P(X>k-)j), k> 3j. 


4. J'ai décidé de vendre ma maison et d’accepter la 1" offre d’achat supé- 
rieure à À <€. On suppose que les offres d’achat sont des variables aléa- 
toires indépendantes avec fonction de répartition F. Soit N la variable 
aléatoire discrète suivante : 

N = nombre d'offres d’achat reçues avant de vendre la maison. 
Donner la loi de probabilité de N, c’est-à-dire P(N =n), ne N. 


2.20 (Loi hypergéométrique) 


On considère une urne avec N boules dont r sont rouges et N —r sont noires. 
On tire n boules au hasard sans remise. Soit X la variable aléatoire discrète 
suivante 

X = « nombre de boules rouges parmi les n boules tirées ». 


1. Calculer la loi de probabilité de X, c’est-à-dire P(X = k) pour k = 
0,..., min(n,r). 

2. Cette loi est dite loi hypergéométrique. Son espérance est E(X) = np et sa 
variance est var(X) = np(1l — p)i+, où p = +. Comparer intuitivement 
avec la loi binomiale. 
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Corrigés 
24 


Soit U1 la variable aléatoire « utilité dans la stratégie sans le test WB » et 

U la variable aléatoire « utilité dans la stratégie avec le test WB ». 
1. On complète le tableau donné dans l’énoncé. La somme de toutes les 
probabilités est égale à 1 ce qui implique que la probabilité manquante est 
P(+.,—,-—) = 0,00046. De plus, on trouve les utilités U2(—,+,—) = —c1—c2 


et Uo(—, — ,—) = —ci. 
2. On calcule l’espérance de U2 
4,3,k=+ 


= —c —0,0293c — 0,00055Lr — 0,0001L7r = —573.03. 


3. On construit le tableau de probabilités et on calcule l’espérance pour U:. 


Vrai statut HIV | Statut ELISA 


Par exemple, on a calculé 
P(+,+) = P(+,+,4) + P(+, +,-—) = 0,00945 + 0,00005 = 0,0095, 
et l’espérance est 
E(U1) = —c1 — 0,0005L; — 0,0198Lrr = —539,8. 
4. On choisit la stratégie qui a la plus grande espérance, c’est-à-dire la 1°. 
Cette conclusion ne tient évidemment compte que de l'utilité. D’un point 
de vue médical, il est évident que la 2° stratégie est la meilleure puis- 


qu’elle donne des diagnostics beaucoup plus sûrs. On pourrait imaginer 
d'augmenter Lr et Lyr pour pénaliser les mauvais diagnostics. 


LA 


Soient X le « nombre de tirs nécessaires pour tuer l’ours » et la probabilité 
P(tuer l'ours) = p. 


1. 
P(X =1) =  P(tuer l'ours) =p 
P(X =2) =  P(rater l'ours, et le tuer) = (1 — p)p 
P(X =3) =  P(rater l'ours 2 fois, et le tuer) = (1 — p)?p. 
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2. La probabilité P(X < 3) correspond à la probabilité que l’ours reste 
vivant. Elle vaut 


3 
P(X<3)= 9 P(X=i) = p(3-3p+p°). 


i=1 


3. On pose E(X) = 1/p. Pour rester vivant, il faut que le nombre de tirs 
disponibles soit plus grand ou égal à la moyenne du nombre de tirs né- 
cessaires pour le tuer 

1 

3 


QI 


4. Le stress diminue la probabilité de tuer l’ours: P(tuer l'ours au 1° coup) = 


p'. Ainsi 
P(X=1)=p=P(X =1) 
P(X =2)= (1- p}p°? < P(X = 2) 
P(X = 3) = (1—p)(1— p°)p° < P(X =3) 
LR 


Soit X la variable aléatoire « nombre d’essais pour ouvrir la porte ». 
1. 


1 
P(X =1) = —- 
(X=1) = ; 
3 1 1 
P(X =2) — 2. à 
2 LÀ 
P(X =3) — 1. 
3 2 1 1 
P(X =4) — 1 no, 
2. On calcule l'espérance et la variance de X 
1 1 1 1 5 
POLE MINE DE Po ELA EE 
9 17 17 at 4 2 
1 1 1 1 25 5 
D'ORPE GER CUP QE EEE D ee 
V(X) = E(X°) (X) PU A UD Dur 


2.4 


Soit X la variable aléatoire « classe d'appartenance ». 
1. Pour calculer les probabilités P(X = k), k = 1,...,5, on prend les fré- 
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quences mesurées. 


RE  _ dite jedeir. 
BE LE LUS 


CFP ET (0 Lois [o.67 [020 [09 | 


P@<X<A4) = P(X <5)-— P(X < 3) = 0,98 — 0,62 = 0,38. 
P(X>4) = P(X =5)= 0,02. 
3. 
5 
E(X) = 2 k-P(X=k) = 2,33 
k=1 
5 
V(X) = E(X?)-E(xX)= SN k2.P(X =k) — 2,33? = 0,88. 
k=1 


2.9 


Soit À la variable aléatoire « nombre de chiffres transmis de façon incor- 
recte », qui suit une loi binomiale de paramètres (5, 0,2). La probabilité d’avoir 
une erreur est égale à la probabilité de recevoir au moins 3 chiffres incorrects. 
Ainsi 


P(erreur) = P(X > 3) = C50,2% - 0,8? + C50,24 - 0,8 + C50,25 © 0,058. 


2.6 


Soit X la variable aléatoire « nombre de pommes avariées dans un embal- 
lage ». 


1. La variable aléatoire X suit une loi binomiale de paramètres (5, 0,25). 


2. Un client se plaint s’il trouve au moins 2 pommes avariées, donc 


47 
P(X >2)=1- P(X < 2) = 1— C$0,75° — CŸ0,25 : 0,754 — 13 © 0:37. 


3. Soit Y la variable aléatoire « nombre de clients non satisfaits ». Elle suit 


une loi binomiale de paramètres (100, 47/128). On en cherche l'espérance: 


47 
E(Y)=100- 2 © 36,7. 


Sur les 100 clients, environ 37 viendront se plaindre en moyenne. 
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dl 


Gianni se dit: « J’ai une chance sur 10 000 d’avoir un accident sur 1 km. 

Comme j'en parcours 10 000, j’ai une probabilité de 10 000 - 5 = 1 d’avoir 
un accident. » 
Posons le problème: appelons X la variable aléatoire « nombre d’accidents sur 
10 000 km ». Elle suit une loi binomiale de paramètres (10 000, 0,0001) qu’on 
peut approximer par une loi de Poisson de paramètre (10 000: -— = 1). On 
cherche la probabilité d’avoir au moins un accident, soit 


P(X>1)=1-P(X=0)=1-e != 0,63. 


Gianni n’a « que » 63 % de chance d’avoir un accident sur 10 000 km. 


Re) 


Soit X la variable aléatoire « nombre de personnes qui acceptent l’inter- 
view ». Lorsqu'il y à 5 noms sur la liste, la variable aléatoire X suit une loi 
binomiale de paramètres (5,2/3). Donc 


9 5 
Pr =bir= Ce () = 0,13. 


S'il y à 8 noms sur la liste, la variable aléatoire X suit une loi binomiale de 
paramètres (8,2/3) et la probabilité de pouvoir réaliser au moins 5 interviews 
est 


2.9 


Soit X (respectivement Ÿ) la variable aléatoire « nombre de passagers qui 
ont réservé une place avec la compagnie SA Airlines (respectivement BA Air- 
lines) et n’effectuent pas le vol ». Les variables aléatoires X et Y suivent des lois 
binomiales de paramètres (94, 0,05) et (188, 0,05). On les approxime par des 
distributions de Poisson de paramètre 94 - 0,05 = 4,7 et 188 - 0,05 = 9,4 respec- 
tivement. Un passager qui a réservé un siège ne pourra pas prendre place dans 
un avion SA Airlines si moins de À personnes ayant réservé n’effectuent pas le 
vol (moins de 8 personnes pour la compagnie BA Airlines). Par conséquent, on 
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calcule 
4 4 ; AT 
P(X <4) — > P(X = i) = > e ME = 0,49 
_ ; = _9 49,4 
P(Y <8) — > P(Y =i) = > e cu = 0,40, 


On en conclut que c’est avec la compagnie BA Airlines qu’un passager ayant 
réservé risque le plus de ne pas pouvoir prendre l'avion. 


2:10 


Soit X (respectivement Y et Z) la variable aléatoire « nombre de raisins 
(respectivement pépites et morceaux [raisins + pépites|) dans un biscuit ». 


1. La variable aléatoire X suit une loi binomiale de paramètres (600, 1/500) 
que l’on approxime par une loi de Poisson de paramètre 1/500-600 = 1,2. 
La probabilité qu’il n’y ait pas de raisin dans le biscuit est 


1,29 
P(X = 0) = Cor = 0,30. 


2. Selon le même raisonnement, la variable aléatoire Y suit une distribution 
de Poisson de paramètre 1/500 - 400 = 0,8. Ainsi, la probabilité qu’il y 
ait exactement 2 pépites de chocolat est 


2 
PES ed = 0,14. 


3. Finalement, la variable aléatoire Z suit elle aussi une loi de Poisson, 
de paramètre 1/500 + 1 000 = 2 et la probabilité de trouver au moins 
2 morceaux dans le biscuit est 


20 2 
P(Z>2)=1-P(Z <2)=1-e 7e? = 0,59. 


2-1 


1. Soit X la variable aléatoire « nombre de champignons toxiques », qui suit 
une loi binomiale de paramètres (6, 0,7). 
(a) La probabilité que Nadine ramasse exactement 4 champignons toxi- 
ques est 
PIX =4)= CP 077-2037 = 0.22, 
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(b) On cherche la probabilité que tous les champignons ramassés soient 
comestibles. Les probabilités que Nadine et Serge ramassent des 
champignons comestibles sont indépendantes. Aïnsi 


P(tous comestibles) = 


—  P(Nadine ramasse 3 comestibles N Serge 4 comestibles) 
0,3? - 0,94 + 0,018. 


2. (a) Soit Y la variable aléatoire « nombre de champignons ramassés en 
une heure ». Elle suit une loi de Poisson de paramètre 12. 


128 
P(Y =8)= 


-e 2 + 0,066. 
(b) Soit Z la variable aléatoire «& nombre de champignons ramassés en 
20 minutes », qui suit une loi de Poisson de paramètre 2 = À, 


49 
P(Z321)=1-P(Z=0)=1-27.e "20,98. 


2:10 


Appelons stratégie I (respectivement IT) la stratégie qui consiste à utiliser 
4 haut-parleurs de 4 000 W (respectivement 2 de 8 000 W). Soit V7 (respective- 
ment Vyr) l'événement « le concert peut se terminer avec la stratégie I (respec- 
tivement IT) ». Soit X7 (respectivement X7r) la variable aléatoire « nombre de 
haut-parleurs en panne si on se trouve dans la stratégie I (respectivement IT) ». 
Les variables aléatoires X7 et X77 suivent chacune une loi binomiale, de para- 
mètre (4, 0,2) et (2, 0,2) respectivement. On veut choisir la stratégie avec la 
plus grande probabilité de voir le concert se terminer. 


P(W) = P(XI<2)=1- P(X1=3)- P(Xr=4) = 
4 4 

1 0,2% . 0,8 — 2% = 
() ? + (je 0,97 


2 
P(Vir) = P(Xr1 <1)=1- P(Xrm =2)=1- (Jos = 0,96. 


Il 


et 


On choisit donc la stratégie I. 


D 19 


Pour à — 1,...,20, soit X; une variable aléatoire telle que 


= { 1 si le à canard survit; 


O0 sinon. 


38 Maîtriser l’aléatoire 


Un canard survit si les 10 chasseurs le manquent, donc 


PX=0={1-2) 

G=n=(-$) 

1. Soit Y la variable aléatoire « nombre de canards épargnés ». On en cherche 
l'espérance 


20 20 
E(Y) = B(Sx) Sert en 0-70 0) = 


i=1 


20 (1- À). 


Il 


2. Soient N la variable aléatoire « nombre de canards » et Z la variable 
aléatoire « nombre de canards touchés ». On cherche l’espérance de Z. La 
difficulté du calcul provient du fait que Z dépend de la variable aléatoire 
N. On cherche 


E(Z) = S kP(Z = k). 
k=0 


On ne connaît la probabilité P(Z = k) que si N est fixé. On utilise donc 
la formule des probabilités totales 


P(Z=RH)=S PC=RIN=HP(N=i) 
i=1 
pour trouver 


E(Z) = SES PZ=RIN=DP(N=5) 


Le tableau 2.1 résume les résultats de l’exercice pour différentes valeurs de la 
probabilité p. 
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GT LOS 06 [07 | 09 


Vol de 20 canards | 0,98 | 2,81 | 4,47 6-13) 


N = P(15) 6,81 


Tableau 2.1 — Tableau d’espérances de l’exercice 2.13. 


2.14 


1. Soit X la variable aléatoire « nombre de soldats malades ». La variable 
aléatoire X suit une loi binomiale de paramètres (500, 0,001) et la pro- 
babilité que les test soit positif revient à calculer 

P(X > 0)=1-— P(X = 0) = 1 — 0,999%0 = 0,394. 
Il faut noter qu’il aurait été possible d’approximer la distribution de X 
par une loi de Poisson d’espérance 0,5 pour obtenir le même résultat. 

2. On cherche à présent la probabilité qu’il y ait plus d’un malade alors que 


le test est positif et on obtient 


P(X>1et X >0 P(X >1 
P(X>1|X>0) = POP NEEEEU) EC 


P(X > 0) 7 P(X>0) 
__ 1-P(X=0)-P(X=1) 
_ 1 P(X =0) 
0,394 — (9°) - 0,001 - 0,999 
De 7j) DA): 
0,394 


2:19 


Soit X la variable aléatoire « nombre de blocages de mâchoire par mois ». 
La variable aléatoire X suit une loi binomiale de paramètres (4 000, 0,001) 
qu’on approxime par une loi de Poisson de paramètre 4 000 - 0,001 — 4. 

1. La probabilité qu’il y ait au moins 3 blocages de mâchoires en 1 mois est 

2 2 4k 
= BA —4 
P(X>3)=1-S P(X=k)=1-$ e 5 


k=0 k=0 


= 0,76. 


2. Soit Y la variable aléatoire « nombre de mois comptant 3 blocages de 
mâchoire ou plus ». Cette variable suit une loi binomiale de paramètres (8, 
p), p étant le résultat du calcul précédent (p = 0,76). Ainsi 

3 
P(Y 24) = 1-P(Y <4)=1-S P(Y=Kk)= 
k=0 
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3. Soit N la variable aléatoire « numéro du premier mois qui voit au moins 
3 blocages de mâchoire ». N suit une loi géométrique avec probabilité p 
(calculée en 1.). Par conséquent, 


P(N=i)=(1-p}"!.p, avecp=0,76, i=1,2,...,8, 


et on trouve les probabilités du tableau 2.2. 


Tableau 2.2 — Tableau des probabilités de l’exercice 2.15. 


2.10 


Soient X la variable aléatoire « nombre de dés qui montrent le chiffre misé » 
et G la variable aléatoire « gain réel du joueur ». La variable aléatoire X suit 
une loi binomiale de paramètres (3, 1/6). La variable aléatoire G, qui dépend 
de X, peut prendre les valeurs -1, 1, 2 et 3, suivant qu'aucun, 1, 2 ou 3 dés 
montrent le résultat pronostiqué. 

1. Aïnsi, l'espérance du gain d’un joueur est 


k=—0 
5\° 5\° 25 1\° 
= -1.@{[- CSSS DOVE | LESC (= 
8(à) + : () + AC NL 
17 
356 © 0,07€ 


2. Soit y le montant que l’on reçoit si les 3 dés montrent le chiffre prévu. Si 
on veut un jeu fair, il faut que 


1 
E(G(X))= 2 (-1-5-5.54+1:3-5.54+2-3-5+y:1) —0, 


donc 
y = 20£. 


AIT 


Soit N(t) la variable aléatoire « nombre d’arrivées dans l'intervalle t ». Elle 
suit une loi de Poisson de paramètre At. Soit 7% la variable aléatoire « temps 
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avant l’arrivée de la k° personne ». 


1. On cherche la loi de T1. Si aucune personne ne se présente au guichet 
avant l'instant t, cela signifie que Ti > t. Aïnsi 


P(Ti > t) = P(N(t) =0) 
et 
Fr (t) = PT <t)=1-P(T > =1-P(NG)=0)=1-E "À, 


On en déduit que 7; suit une loi exponentielle de paramètre À. 


2. On cherche à présent la fonction de répartition de 7%. Si T% < t, cela 
signifie que la k° personne est arrivée avant l'instant t, ou que N(t) > k. 
Donc 


'e) ee : \t j 
Fr, = PT <t)= P(INO >h) = PIN =j)=d e MO 
j=k : 
3. La fonction de densité de 7% est, par conséquent 


ôt 
a JL j 
= ÿ Ce" . Di _ Xe ?t ce ) 
j—1)! j! 
j=k 
Cie À 


CURE CI 


Jr) = LR = > (et pen) 


Ty suit une loi Gamma de paramètre (n, k). 


A Ro 


Soit X la variable aléatoire « nombre de skieurs qui se présentent entre 
2 passages d’Andi ». La variable aléatoire X suit une loi géométrique de para- 
mètre p. Andi reprend la même perche au passage suivant si &N — 1 skieurs se 
présentent entre ses 2 passages, avec k = 1,2, ... La probabilité qu’il reprenne 
la même perche est donc 


P(même perche) — S_P(X =kN —1)= ÿ QUNTD I. D = LE SGEN 
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où q = 1 — p. La dernière somme est une série géométrique de raison q". Par 
conséquent 


P(même perche) — 
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2:19 


Soit X la variable aléatoire « nombre d'épreuves nécessaires pour obtenir 
le premier succès ». 

1. P(X = k) = P(k — 1 échecs et un succès) = (1—p)*-lp, k—1,2,3, 

2. En utilisant 0 <g=1-p<l,;ona 


OO CO CO d 
— k—1, _ k—1 _ k 
E(X) = D k(p-1)-'p=pS kg =D (5x) 
k=1 k=1 k=1 
dd d q 1 1 
= p— d | =p——=p = - 
(4) dg1-g (1-q* p 
& 
; P(X>kKNX>j) P(X>k) 
P(X>Kk|X HE RS EN PER) 
on PX>)  PA>J) 
sp 


= CD 6 pers -p, 


où l’on a utilisé P(X > k) = (1 — p}f. 

4. Soient Ÿ la variable aléatoire « valeur de l’offre d’achat » avec fonction de 
répartition F'et N la variable aléatoire « nombre d’offres d’achat reçues 
avant de vendre la maison ». Aïnsi 


P(N=n)=[P(Y <k)Ï"! P(Y > k) = F(k)"-1(1— F(k)). 


2.20 


On a N boules; r sont rouges et N — r sont noires. Soit X la variable 
aléatoire « nombre de boules rouges tirées ». On procède au tirage de n boules 
sans remise. 
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2. On veut comparer l’espérance et la variance de la loi hypergéométrique 
avec celles de la loi binomiale. Pour rappel, les tirages d’une loi binomiale 
sont avec remise. Soit Ÿ une variable aléatoire de distribution binomiale 
avec paramètres (n,p). On sait que E(Y) = np et V(Y) = np(l — p). 
Ainsi 


E(X) = E(Y) 
V(X) = TV) < V(Y). 


Si N est beaucoup plus grand que n, le rapport (N—n)/(N—1) tend vers 1 
et V(X) vers V(Y). En d’autres termes, en augmentant considérablement 
la quantité de boules dans l’urne, un tirage ne modifie presque plus la 
probabilité de tirer une boule rouge et on peut faire l’approximation que 
le tirage est sans remise. 


Chapitre 3 


Variables aléatoires 
continues 


Introduction 


Le passage des modèles discrets aux modèles continus intervient dans beau- 
coup de domaines de la science. Dans notre cas, cela consiste à considérer un 
passage à la limite d’une loi de probabilité discrète quand l’ensemble des va- 
leurs possibles de la variable aléatoire augmente et devient toujours plus dense. 
Ceci conduit à caractériser une variable aléatoire continue par sa fonction de 
densité, une fonction non-négative et telle que l'intégrale (la surface totale) 
au-dessous de cette courbe soit égale à 1. La probabilité est représentée par la 
surface au-dessous de la courbe correspondant à un intervalle donné 


b 
P(X € [a, b]) = f(x)dx , 


où f(.) est la fonction de densité. Une variable aléatoire continue peut aussi être 
caractérisée par sa fonction de répartition F(x) = P(X < x), par sa fonction 
de survie S(x) = P(X > x) ou par sa fonction de risque À(x) = : 

La première partie de ce chapitre présente des exercices sur ces outils de 
base (exercices 3.1 à 3.10). Comme dans le cas discret, on à ensuite recueilli 
les exercices concernant quelques lois continues de probabilité. On traite en 
particulier la loi de base la plus simple, la loi uniforme, ainsi que la loi la plus 
importante, la loi normale (exercices 3.11 à 3.17). 

Des exercices concernant la loi d’une transformation d’une variable aléatoire 
continue (exercices 3.18 à 3.27) ainsi que d’autres aspects concernant les lois 
continues (exercices 3.28 à 3.39) concluent ce chapitre. 
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La loi uniforme 


La loi uniforme est la loi continue la plus simple. Une variable aléatoire X 
suit une loi uniforme sur l’intervalle [a, b], X + U(a, b), si sa fonction de densité 
est égale à 1/(b— a) sur l'intervalle [a, b] et 0 aïlleurs. La loi {{(0,1) joue un rôle 
particulier car des algorithmes permettent la génération efficace par ordinateur 
de réalisations (« nombres aléatoires ») d’une variable aléatoire qui suit cette 
loi. Cela permet ensuite de générer des réalisations de variables aléatoires qui 
suivent d’autres lois discrètes ou continues (exercices 3.27, 3.31, 3.37 et 3.38). 
Ceci est à la base des techniques de simulation de processus aléatoires par 
ordinateur, un outil indispensable pour la modélisation statistique moderne. 


La loi normale 


La loi normale a ses racines et sa justification dans le théorème central 
limite (voir l'introduction du chapitre 5). La fonction de densité d’une variable 
aléatoire normale standard, X = W(0,1), est donnée par 


1 1 0 
g(x) = mn ke 


On à E(X) = 0 et var(X) = 1. Notons comme curiosité que l’importance de 
cette loi se reflète aussi dans le fait que sa densité w(x) contient trois concepts 
fondamentaux en mathématiques, les nombres 4/2, T, e. 


Notes historiques 
En ce qui concerne la loi normale, voir l'introduction du chapitre 5. 


Références (théorie) 


Ross, chapitres 5 et 7 [1] et Pitman, chapitre 4 [2]. 
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Exercices 


Moments et probabilités 


3.1 


Soit X une variable aléatoire continue de fonction de densité f(x). 
1. Démontrer que var(X) = E(X?) - (E(X))?. 
2. Démontrer que var(aX) = a?var(X). 


3.2 


Soit À une variable aléatoire dont la fonction de densité est 
c(l—x?) —-1<x<1 


1e { 0 sinon. 


1. Calculer la valeur de c. 
2. Quelle est la fonction de répartition de X°? 
3. Calculer E(X). 


3.3 


Soit À une variable aléatoire dont la fonction de densité est 


f(x) = { sin(r) O<r<f 


0 sinon. 


1. Quelle est la fonction de répartition de X? 
2. Calculer E(X). 
3. Calculer Var(X). 


3.4 


On dit que la variable aléatoire X suit la loi exponentielle de paramètre À, 
notée e(À), si sa densité est 


1. Calculer la fonction de répartition F(x). 
2. Que vaut le a-quantile q = F1(a)? 
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3.9 


Soit À une variable aléatoire de densité 


__ f c(a)(a?—-x?) si xl <a 
iQ { 0 sinon. 
1. Déterminer la constante de normalisation c(a). 
2. Donner la fonction de répartition de X. 
3. Calculer E(X) et var(X). 


3.6 
Soit f(x) une fonction de densité définie sur R. On définit 
€ .(x 
fre) = (1-9) f(0) + 5f(5), 


où 0 < e < 0,05 et b > 1, une perturbation de f(x). 


1. Montrer que f(x) est une fonction de densité. 

2. Soit f(x) la densité d’une distribution normale avec espérance 0 et va- 
riance 1. Calculer E(X) et var(X), où X + fes(x). 
Indication : pour la dérivation de la variance, calculer E(X?). 

3. Soit b — 3 et € — 0,05. Interpréter f.s(x) du point 2. et comparer 
avec f(x). 


3.7 


Tous les jours, Sébastien parcourt le même trajet de 40 km pour se rendre 
à son travail. Sa vitesse est une variable aléatoire V qui dépend des conditions 
météorologiques et de la circulation. Sa densité est de la forme 


__f Cvexp(—-Av) v>0 
JV) = { 0 sinon. 
Sébastien roule à une vitesse moyenne de 80 km/h. 
1. Déterminer les valeurs de Cet de À. 


2. La durée du trajet est décrite par la variable T' — 20. Déterminer la 
densité et l’espérance de T. 


3.8 


La fonction de densité de X, variable aléatoire représentant la durée de vie 
en heures d’un certain composant électronique, est donnée par 


10/x? > 10 
FE { 0 ie 10. 
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1. Trouver P(X > 20). 

2. Quelle est la fonction de répartition de X°? 

3. Quelle est la probabilité que parmi 6 composants, au moins 3 d’entre eux 
fonctionnent au moins 15 heures? Quelles hypothèses faites-vous ? 


4. Calculer E(X). 


3.9 


La quantité de pain (en centaines de kilos) qu’une boulangerie vend en 
1 journée est une variable aléatoire X de fonction de densité 


CT 0<x<3 
f(æ)=4 «6-x) 3<x<6 
0 sinon. 


1. Calculer la valeur de c. 

2. Quelle est la fonction de répartition de X°? 

3. Soit À l’événement : « le nombre de kilos de pain vendus dans une journée 
est supérieur à 300 kg ». Soit B l’événement : « le nombre de kilos de pain 
vendus dans une journée est compris entre 150 et 450 kg ». Les événements 
sont-ils indépendants ? 


3.10 


La durée de vie X en années d’une télévision suit une loi exponentielle de 
densité 


8 x>0. 


f(a)= ge 

1. Calculer la probabilité que la télévision que vous venez d’acheter ait une 
durée de vie supérieure à 8 ans. 

2. Vous possédez une telle télévision depuis 2 ans. Quelle est la probabi- 
lité que sa durée de vie soit encore de 8 ans à partir de maintenant ? 
Conclusion. 

3. Quelle est la durée de vie moyenne E(X) d’une télévision ? Et la variance 
de cette durée de vie? 


Loi normale 


3.11 


La longueur des pièces produites par une machine de type À varie selon 
une loi normale avec espérance 8 mm et variance 4 mm, et la longueur de celles 
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produites par une machine de type B varie selon une loi normale avec espérance 
7,5 mm et variance 1 mm. 


1. Si vous voulez produire des pièces de longueurs 8 + 1 mm, quel type de 
machine choisiriez-vous ? 

2. Si la moyenne des longueurs produites par la machine À reste 8 mm, 
quelle doit être sa variance pour qu’elle ait la même performance que la 
machine B? 


3.12 


On suppose que la taille, en centimètres, d’un pygmée âgé de 25 ans est une 
variable aléatoire normale de paramètres u = 140 et o = 6. 
1. Quel est le pourcentage de pygmées de 25 ans ayant une taille supérieure 
à 150 cm? 
2. Parmi les pygmées mesurant plus de 145 cm, quel pourcentage dépasse 
150 cm? 


3.13 


On suppose que la taille, en centimètres, d’un homme âgé de 30 ans est une 
variable aléatoire normale de paramètres u = 175 et o? = 36. 
1. Quel est le pourcentage d'hommes de 30 ans ayant une taille supérieure 
à 185 cm? 
2. Parmi les hommes mesurant plus de 180 cm, quel pourcentage dépasse 
192 cm? 


3.14 


Un entrepreneur doit estimer le temps nécessaire à l’exécution d’un travail. 
Les incertitudes dues au marché du travail, à l’approvisionnement en maté- 
riaux, aux mauvaises conditions atmosphériques ... constituent une inconnue. 
Néanmoins, il affirme qu’il a une probabilité de 10 % de réaliser le travail en 
plus de 190 jours et une probabilité de 5 % que le travail soit terminé en moins 
de 50 jours. Soit X la variable aléatoire, supposée normale, désignant le nombre 
de jours nécessaires à l’exécution du travail. 

1. Donner l’espérance et la variance de X. 

2. Que vaut la probabilité que la durée du travail dépasse 200 jours ? 


3.15 


Le samedi soir, la police fait un alcootest à tous les conducteurs qui passent 
par une route principale. Quelle est la proportion d’automobilistes recevant une 
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amende (taux d'alcool > 0,08 %) si l’on suppose que le taux d’alcool chez les 
automobilistes est distribué selon une loi normale d'espérance y = 0,07 % et 
d’écart-type o = 0,01 %? En plus de l’amende, les conducteurs ayant plus de 
0,09 % ont un retrait de permis. Parmi les automobilistes réprimandés, quelle 
est la proportion de retraits de permis ? 


3.16 


Lors d’un procès en attribution de paternité, un expert témoigne que la 
durée de la grossesse, en jours, est de distribution approximativement normale 
avec paramètres y — 270 et a? — 100. L'un des pères putatifs est en mesure de 
prouver son absence du pays pendant une période s'étendant entre le 290° et le 
240° jour précédent l’accouchement. 

Quelle est la probabilité que la conception de l’enfant ait eu lieu plus de 
290 jours avant sa naissance ou moins de 240 jours avant? 


3.17 


Sur une route principale où la vitesse est limitée à 80 km/h, un radar à 
mesuré la vitesse de toutes les automobiles pendant une journée. En supposant 
que les vitesses recueillies soient distribuées selon une loi normale avec une 
moyenne de 72 km/h et un écart-type de 8 km/h, répondez aux questions 
suivantes. 

1. Quelle est la proportion de conducteurs qui devront payer une amende 

pour excès de vitesse ? 

2. Sachant qu’en plus de l’amende, un excès de plus de 30 km/h implique 

un retrait de permis, quelle est la proportion des conducteurs qui vont se 
faire retirer le permis parmi ceux qui vont avoir une amende ? 


Transformations de variables 


3.18 


Soit X = W(0,1) et définissons Y = X?2. 
Trouver la fonction de répartition de Y et sa densité. Représenter graphique- 
ment cette densité. 
Cette distribution est appelée une loi de x? (chi carré à un degré de liberté). 


3.19 


Soit V + (0,1). Calculer la fonction de répartition de W = = In(V) et sa 
densité. De quelle loi s’agit-il? 
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3.20 


Soit X une variable aléatoire distribuée suivant la loi de Weibull de para- 
mètres a > 0 et 5 > 0. La densité de X est donc définie par la fonction 


4 B—1 4 : 
= (2) (2) exp{-(£)] si z>0 
0 sinon. 
Soit Y = (X/ a)? . Calculer la fonction de densité de Y. De quelle loi s'agit-il? 


3.21 


Soit X = y? et définissons Y = In(X}). Trouver la fonction de répartition 
de Y et sa densité. 


3.22 


Supposons qu’une administration fiscale, dans la déclaration d’impôt d’un 
indépendant, ne prenne en compte des déductions professionnelles autorisées et 
justifiées qu’à partir de 5 000 €. Soit X (exprimé en milliers d’euros) le total 
des déductions d’une déclaration choisie au hasard. La variable aléatoire X est 
supposée suivre une loi dont la densité est fx(x) = Æ si x > 5. 

1. Déterminer la valeur de k. Quelle restriction sur & doit-on faire afin que 

f(x) soit une densité? 
2. Déterminer la fonction de répartition Fx(x) de X. 
3. Montrer que Y = In(X/5) suit une loi exponentielle de paramètre (a —1). 


3.23 


Une variable aléatoire X suit une distribution de Pareto de densité 


ie axgzr (ta) si x > to 
n 0 sinon. 


avec to > 0et a > 1. 
Trouver la densité de la variable aléatoire Y = In(X). 


3.24 
Soit V une variable aléatoire distribuée suivant la loi de Cauchy de densité 
1 1 
f(v) = TA +) vER. 


Soit Z — 1/V. Calculer la densité de Z. Que remarquez-vous ? 
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3.25 


Dans un atelier de céramique on produit des petites plaques carrées de 
largeur L. Cette valeur L est une variable aléatoire dont la fonction de densité 
est définie de la manière suivante 


pepe HeU-9 QE 


1. Calculer la fonction de densité de la surface S d’une plaque. 
2. Calculer l’espérance de la variable aléatoire S. 


3.26 


Dans une usine, on fabrique des boules pour la décoration de sapins de 
Noël. Le rayon de ces boules est une variable aléatoire R qui a pour fonction 
de densité 2, 

_ 57 3—T7) O<r<3 
fr(r) { 0 sinon. 
1. L'usine s’intéresse à la quantité de matière nécessaire pour fabriquer ces 
boules et demande de calculer la fonction de densité de la surface S — 
4rR? d’une boule. 


2. Calculer l’espérance de la variable aléatoire S. 


3.27 


Soit X une variable aléatoire continue ayant une fonction de répartition F. 
On définit la variable aléatoire Y par Y = F(X). 
Montrer que Ÿ est uniformément distribuée sur l'intervalle (0, 1). 


Exercices combinés 


3.28 


Les pièces d’une voiture sont souvent copiées et vendues comme pièces ori- 
ginales. On veut remplacer certaines pièces d’une voiture. Avec probabilité 1/4, 
on achète une pièce piratée et avec probabilité 3/4 on achète une pièce origi- 
nale. La durée de vie est une variable aléatoire exponentielle avec espérance 2 
pour une pièce piratée et avec espérance 5 pour une pièce originale. Appelons 
T la durée de vie de la pièce que l’on achète. Supposons que la pièce ait survécu 
jusqu’au temps t après son installation. Quelle est la probabilité r(t) que cette 
pièce soit piratée? Trouver la limite de r(t) lorsque t — co. 
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3.29 


Un point est choisi au hasard sur un segment de longueur L. 
Trouver la probabilité que le rapport entre le plus petit et le plus grand segment 
soit inférieur à 1/4. 


3.30 


Afin de définir une politique sociale à long terme, on désire étudier l’évolu- 
tion du sida. On s'intéresse alors à modéliser la fonction de survie des malades. 
Notons S(t) = 1— F(t) la fonction de survie et A(t) = — 205$) la fonction de 
risque {hazard function). 

1. Dans un 1* temps on va supposer que le risque est constant, c’est-à-dire 
que h(t) = À. Trouver la fonction de densité des données. De quelle loi 
s'agit-il? 

2. En 2° lieu on supposera que A(t) = Ak(Xt)"-!. Trouver la fonction de 
densité des données. De quelle loi s’agit-il? 


3.31 


En analysant les temps de survie des start-up, on note que plus la société 
a été en activité et plus petite est la probabilité qu’elle fasse faillite le mois 
prochain. Ceci implique une fonction de risque À(t) décroissante avec le temps t. 
Un modèle utilisé est A(t) = (a +t)-!,#t > 0, où a est un paramètre positif. 


1. Calculer la fonction de survie P(T > t), où T représente le temps de 
survie. 

2. Quelle est la médiane de T'? 

3. En utilisant 2., donner une interprétation du paramètre a. 

4. Proposer un algorithme pour simuler à l’ordinateur des temps de survie 
t1,-..,tn à partir d’une série u1, ...,u, de réalisations d’une variable 
aléatoire uniforme dans l'intervalle (0, 1). 


3.32 


Un vendeur de journaux achète ses journaux 10 centimes et les revend 
15 centimes. Cependant, il ne peut pas se faire rembourser les exemplaires 
invendus. 
La demande journalière X est une variable aléatoire normale de paramètres 
u = 100 et a? = 200/3. 
1. Si s est le nombre de journaux qu’il achète, donner l’espérance de son 
bénéfice en fonction de s et de fx, la fonction de densité de X. 
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2. Quel est approximativement le nombre de journaux qu’il doit acheter afin 
de maximiser l’espérance de son bénéfice ? 


3.33 


Soient n parts budgétaires indépendantes X3,...,X,, suivant une loi uni- 
forme dans l'intervalle (0,1). Calculer la fonction de répartition et la densité 
de Y = min(X1,..., Xh). 


3.34 


Un analyste financier dispose de données historiques X1,...,X, de rende- 
ment d’une certaine action. On suppose par simplicité que ces observations 
sont indépendantes avec fonction de répartition Fx(x) et densité fx(x). Soit 
T = max(X1,..., X,) la variable aléatoire qui représente le rendement maxi- 
mal. 


1. Montrer que Fr(t) = (Fx(t))", où Fr(t) est la fonction de répartition 


de T'. 
2. Soit 
2 : 
: mt S0<zr<0 
Fx(e) = { 0 sinon. 


Dans ce cas, calculer E(T). 


3. Sous les conditions du point 2., calculer la probabilité que le rendement 
maximal soit supérieur à un certain seuil a. 


3.39 


La fluctuation journalière du prix de l’action d’une société donnée, cotée en 
bourse, est une variable aléatoire d’espérance 0 et de variance o?. Cela veut 
dire que, si Ÿ, représente le prix de l’action du n° jour 


Ya = Yni+ Un, n > 1, 


où Ui, U», ... sont des variables aléatoires indépendantes identiquement distri- 
buées d’espérance 0 et de variance o?. Supposons que le prix de l’action soit 
aujourd’hui de 100, c’est-à-dire Y1 = y1 — 100, et que o? — 1. 

Donner une borne inférieure pour la probabilité que le prix de l’action sera 
compris entre 95 et 105 dans 10 jours, en utilisant l’inégalité de Chebychev. 
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3.36 


Lorsqu'on s'intéresse aux distributions de revenu, on peut faire un histo- 
gramme à partir des données. Pour étudier certaines propriétés, il est utile 
de disposer d’un modèle se présentant sous la forme d’une densité ajustant 
l’histogramme. Dans ce contexte, la distribution de Dagum se définit par 


Fsxs(x) = (1+2Xx 5) # 


où x est positif, 6 > 0, À>0et 6 > 1. 


1. 
2. 


Quelle est sa densité? 

On prend les paramètres 8 = 0,71, À = 7 883 000, ô = 3 
Quelle est la médiane, c’est-à-dire x» tel que F(xu) = 
L’espérance sera-t-elle égale à la médiane? 

Quels sont les quartiles inférieurs et supérieurs ? 
Indication : trouver la réciproque de F. (Pour cela, poser F(x) = z et 
obtenir x = G(z); G est la réciproque de F.) 


1. 
2 


1 
1 
2 


Pourquoi l’emploi de la loi normale est-il inadapté à l’étude des distribu- 
tions de revenu ? 


. Si pour le même problème on change d’unité monétaire, disons que la 
P P ) q 


nouvelle unité monétaire y vaut 0,80x, quels sont les paramètres B”, \’, et 
6’ de la distribution de Dagum associée à y? En déduire une interprétation 
pour le paramètre À. 


3.37 


Si l’on dispose de 30 réalisations d’une loi uniforme u1, ...,u30, comment 
obtenir 30 réalisations d’une loi de Dagum? (Indication : s'inspirer des exer- 
cices 3.27 et 3.36.) 


3.38 


Un tremblement de terre de magnitude M libère une énergie X telle que 
M = log(X). Pour des tremblements de terre de magnitude supérieure à 3, on 
suppose que (M — 3) suit une distribution exponentielle avec espérance 2. Pour 
les tremblements de terre de magnitude supérieure à 3, calculer : 


1. 


E(M) et Var(M); 


2. la densité de M ; 
3. 
4. la probabilité que la magnitude du plus faible soit supérieure à 4, étant 


la densité et la fonction de répartition de X ; 


donné 2 tremblements de terre avec magnitudes M, et M2 indépendantes. 


On souhaite simuler à l’ordinateur les énergies libérées par un tremble- 
ment de terre. Construire un algorithme permettant de simuler n énergies 
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T1, ..., En à partir de n réalisations u1, ...,u, d’une loi uniforme dans 
l'intervalle (0,1). 


3.39 


Soit S; la valeur d’un actif à la fin de l’année t et Ron le taux de rendement 
sur un horizon de n années, c’est-à-dire que Ron est la solution de l’équation 


Sn = So(i + Ron)”. 
Sous l’hypothèse que - suit une loi log-normale avec paramètres y et o?, 
calculer l'espérance et la variance de Ro». 


re de 15 Si. S2  _Sé Sn pp" St 
Indication : ce — I Si 


569 61 "Sea 
Que se passe-t-il quand n — co? 
Ce problème est basé sur l’article « The Long-Term Expected Rate of Return : 


Setting it Right », publié par O. de la Grandville dans le Financial Analysts 
Journal (1998, pages 75-80). 
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Corrigés 


3.1 

Soit u = E(X). 

1. 

var(X) = E[(X-y)] = E(X?) - EQuX) + E(x?) 
E(X?) — 2uE(X) + p? = E(X?) - p?. 
à. 
var(aX) — E(a?X?) - (E(aX))? = a E(X?) — a (E(X)}? 
= a (E(X?) - (E(X))?) = avar(X). 

ne 


1. Pour calculer la valeur de c, on se sert du fait que l'intégrale de la fonction 
de densité sur tout son domaine est égale à 1. 


Ce] 1 x æ=1 4 
1 f(x)dx = | <a — x? )dx = c (=- 7). su 1 


et donc c = 3/4. 
2. Considérons le cas pour lequel —1 < x <1 


rw=raese ['rot-i(e 5) hf t)+s 


Par conséquent, la fonction de répartition est 


(0) si x < —1 
F(a)=4 x(1-#)+4 sll<1 
1 iz>l 


200 = [” stade 2% [ (e-arya 20 


—0O 4 —1 


Ce résultat est évident car on intègre une fonction impaire (xf(x)) sur 
un domaine centré sur 0. 
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3.3 


1. Si0<x< 7/2 


t=x 


Fx(x) = | sin(t)dt = — cos(t)| = 1— cos(x). 
0 t=0 
Par conséquent 
0 si x < 0 
Fx(x) = 4 1-—cos(x) si0<x< 7/2 
1 sinon. 


2. L’espérance de X est 


7/2 
| æsin(x)dx = 
0 


ñ/2 
= —(x cos(r))5/? + cos(x)dx = sin(x) 
——— —” 0 


=0 


E(X) 


æ=7/2 
=; 1; 


xæ—=0 
3. Calculons le 2° moment de X 


E(X?) 


Il 
— 
à 
Le) 
& 
Le) 
me 
=) 
Pr 
& 
nef 
Q 
S) 
Il 


et la variance vaut 


3.4 


1. La fonction de répartition de X pour x > 0 est 


t=x 
—À 
=l-e *, 
t= 


t 
Fx(x) = Xe Meme # 
0 0 


et donc 
0 si æ <0 


Fx(e) = { le" gix>0. 
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2. Le a-quantile q, est défini comme 
_ p-i 
Ga = Fx (a). 


On en déduit que pour la loi exponentielle, 
Si (1- a) 
ax = ——log(1 — @). 
q Sa a 


3.0 


1. Pour déterminer la constante de normalisation, on utilise le fait que 
CO . . 
Jo f(æ)dx = 1. Ainsi 


oh f(x)dx = A c(a)(a? — x°)dx = c(a) Le = _ L _ (aa = 


et 


FILS 3 [2a x 
Fx(x) —= je a ( — #?)dt = FRE Ce Lx — =) ; 


et globalement 


0 Si æ < —a 
Fx(z)=4 2 (2 + a?x — &) si |x| <a 
1 sit >a 


3. L’espérance de X est 


3 3. lat 4 


T——a 


car la fonction à évaluer est paire en x et prise sur un intervalle symétrique 
autour de 0. Le 2° moment de X est alors égal à la variance de X, ce qui 
implique 
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0.4 


0.2 0.3 


f(x) et f_{3,0.05}(x) 


0.1 


0.0 


—4 —2 (o) 2 4 


Fig. 3.1 — f(x) en trait continu et fe £(x), avec € = 0,05 et b = 3 
en pointillés. 


3.6 


1. f.s(x) est positive et 


+00 +00 +00 
J'hutdr = (0 J'i(drte ['Ef(dr 
+0 +0 
= (-e)+e f ibf(tdt=(1-e)+e f f(bjdt=1 


par le changement de variable t = x/b. 
2. f(x) = (x), où y est la densité d’une variable aléatoire W(0,1) 


+oo +00 +00 
E(X) = el xfev(x)dx = (1 — E)xyp(x)dx vu £ xp(F)dx 
= (1- à T retro + [FC = 0. 
be 'ÉO=e)) omE) Soubde 


— OO 


= (1—-e)+eb =1+e(b2 —1) 


3. fev(x), avec € = 0,05 et b — 3, est une densité centrée en 0 et avec des 
queues plus longues que f(x), cf. figure 3.1. 


62 Maîtriser l’aléatoire 


3.7 
1. Pour déterminer C' et À, on va utiliser 
: Cvexp(—Av)dv = 1 
0 


et 
E(V) = | Cv? exp(—v)dv = 80. 
0 


| Cvexp(—Av)dv = 
0 


arties 1 a on! 

pret ——Cvexp(—ÀAv) +c | — exp(—Àv)du 
À v=0 o À 

ee” 
=0 
C V—OO C 
= —— exp(—Av) — =1 =), 

F2 LEA 2 


cf v? exp(—Av)du = 
0 


v 
parties 


1 me en! 
=" —=Cv exp(—)v) +c | —2vexp(—Av)du 
À 0 po À 
ne” 


=0 
22 TT 2 
_  / Cvexp(—Av)dv = — 80 


se” 
= 


1 1 
— C= —. 
40 1 600 
2. Soit T — 20. Sa fonction de répartition est 


FO=Pr<n=P(r<t)=r(ve$)-1-r (©). 


t 


À 


On en déduit sa fonction de distribution : 


40 40 1 1 
fr (t) = iv () = 7 À (-;) ) 


et finalement, on calcule l’espérance de T': 


Pl 1 oil 1 


Il 

@ 

" 

T 
FES 
re 
Ve. 
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æ—=20 
=1—0,5= 0,5. 


. La primitive de f(x) est 


Pour déterminer ©, on utilise le fait que F(x = 10) = 0 et ainsi, 


10 
C' = F(10) + — = 1. 
ts 10 
Finalement 
0 si &æ < 10 
es { 1—10/x six >10. 
. On calcule en premier la probabilité qu’un composant fonctionne au moins 
15 heures 


P(X > 15) =1- Fx(15) = à 
On fait ensuite l'hypothèse que les durées de fonctionnement des compo- 
sants sont indépendantes, ce qui implique que si Y est la variable aléatoire 
qui décrit le nombre de composants fonctionnant au moins 15 heures, elle 
suit une loi binomiale de paramètres (6,2/3). Par conséquent, la proba- 
bilité qu’au moins 3 composants fonctionnent plus de 15 heures est 


656 

P(Y > 3) — =k)=— = 

PR A 759 — 0:90 
k=3 
. Calculons l'espérance de X 

% 10 Li 
E(X) = — dx = 10log(x) = 00. 

10 Ÿ æ=10 


L’espérance de X est infinie. 


1. Pour trouver la valeur de c, on utilise le fait que l’intégrale de la fonction 


de distribution f(x) sur le domaine de définition de x est égale à 1. Ainsi 


Jr = fers [46 mr 


æ=3 x? æ—6 
+c (62 = =) 
=0 2 


x? 
C— 


Il 


= — _ = 9 
2 T2 C 


“ 
e 
I 
OH 8 
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2. La fonction de répartition se calcule en 2 étapes ; d’abord pour 0 < x < 3 
4 x? 

F = —dt = — 

x (a) 1 CHÉÈT. 


et ensuite pour 3 < x < 6 


3 T 2 1t=3 2 t=x 
t 6—+ t 6t— 12/2 
Ne j cdt+ | CR 
o 9 3 9 18|;_ 9 4=3 
__ 6æ-7»?/2 ; 
= à | 
On obtient alors la fonction de répartition 
0 si æ < 0 
x? /18 Si 0<zx<3 
He S(6œ—2?/2)-1 si3<x<6 
1 si x > 6. 


3. Les événements À et B sont indépendants si 
P(ANB) = P(A)P(B). 


On calcule les 3 termes pour vérifier (ou infirmer) la dernière égalité: 


P(A)= P(X23)=1- Fx(3)= 5, 


puis 
LS 
P(B) = P(15 <X <4,5) = Fx(4,5) — Fx(1,5) = en 
et finalement 
7 1 3 
P(ANB) = P(G < X <4,5) = Fx(4,5) — Fx(3) = So 


On vérifie donc bien que P(A)P(B) = 3/8, ce qui signifie que les 2 évé- 
nements sont indépendants. 


3.10 


Né las z 
P(X > 8) = [ f(x)dx = [l ge ‘dr = —e Ë = el = 0,37. 
8 8 


x=8 


La probabilité que la télévision ait une durée de vie supérieure à 8 ans 
est d’approximativement 37 %. 
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2. On cherche la probabilité que la durée de vie d’une télévision soit supé- 
rieure à 10 ans en sachant qu’elle a déjà 2 ans 
PORSAIONXS2) PRE) LE Là 
PX>OIX > 2) = | 
0? P{X > 2) P(X>2) ea 
Le résultat est le même qu’en 1., car la loi exponentielle est sans mémoire. 
3. Calculons l'espérance de X 


E(X)= | Le dx = —xe-# +/ e7 8 dx = —8e-* = 8. 
0 8 æ=0 0 æ=0 


=0 
Pour déterminer la variance de X, on va utiliser la relation var(X) = 
E(X?) — E(X)°. Le 2° moment s'obtient de la manière suivante 


T—00 


2 Fe 2 -z 
E(X*) = —e 8dx = —2"e & 
0 8 


#16 | Let dx = 2: 8, 
0 8 


æ=0 
=0 =E(X)=8 
et donc 
var(X) = E(X?) - E(X})? = 2.8? - 8? — 64. 
On remarque que var(X) = E(X)?. 


3.11 


Soient X (respectivement YŸ) la longueur des pièces produites par la ma- 
chine À (respectivement B). Les variables aléatoires X et Y suivent une loi 
normale de paramètres (8,4) et (7, 5,1). 

1. On cherche la machine qui a la plus grande probabilité de fabriquer des 

pièces dont la longueur appartient à l’intervalle [7,9]. Premièrement 


P(T<X <9)= P(-0,5 < Z < 0,5) = 2(0,5) — 1 + 0,38, 


où Z est une variable aléatoire de distribution normale centrée et réduite. 
Pour la 2° machine 


P(T<Y <9)= P(-0,5 < Z < 1,5) + 0,62. 


On en conclut que la machine B est meilleure que la machine A. 

2. Soit X* une nouvelle variable aléatoire qui décrit la taille des pièces pro- 
duites par la machine À. Cette variable a la même espérance que X et 
on cherche sa variance o? de telle sorte que les machines soient de qualité 
égale. On veut donc 


1 1 1 
pasxso=p(-i<z<s)-2P(z<5)-1-062 
© © © 
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Ainsi, on trouve 


P (z . 2) = 0,81, 
(0x 


et finalement 


0,88 & o?+1,29. 


al 


La variance de X* devrait être d’environ 1,29 pour que la machine À ait 
la même probabilité que la machine B de produire une pièce de la bonne 
taille (cf. figure 3.2). 


Fig. 3.2 — Fonctions de distribution des variables aléatoires Y 
(courbe pleine) et X* (courbe pointillée) de l'exercice 3.11. 
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3.12 


Soit X la taille en centimètres d’un pygmée âgé de 25 ans. Elle suit une loi 
normale d'espérance 140 et de variance 36. 
1. Le pourcentage de pygmées qui mesurent plus que 150 cm est 


150 — 140 


= ) = 1— (1,67) + 4,8 %. 


P(X > 150) = 1-6 ( 
2. On cherche la probabilité qu’un pygmée mesure plus de 150 cm sachant 
qu'il en mesure au moins 145 


P(X >150NX > 145) 
P(X > 145) 

P(X > 1 1—®(1 

P(X > 150) m 17 2(167) = 23,5 %. 

P(X > 145) 1 %(0,83) 


P(X > 150 | X > 145) 


3.13 


Soit XÀ la taille en centimètres d’un homme âgé de 30 ans. X suit une 
distribution normale de paramètres (175,36). 
1. Le pourcentage d'hommes de 30 ans mesurant plus que 185 cm est 


185 — 175 
P(X > 185)=1-% (=) = 1— (1,67) + 4,8 %. 


2. La probabilité qu’un homme mesurant plus de 180 cm dépasse 192 cm 
est 


P(X>192NX>1 
P(X >192| X >180) — ET 


P(X > 192) 1 (2,83) 
de 
P(X > 180) 1— ®(0,83) 


3.14 


Pour déterminer la variance o° et l'espérance u de X, on utilise l'information 
sur les probabilités pour écrire 2 équations, où Z est une variable provenant 


d’une loi normale centrée et réduite 


P(Z> 2) =01 LOE = P(0,9) + 1,28 
507 4 502 
P(Z > 2) = 0,05 EL = P(0,05) + —1,65, 


ce qui nous permet d'obtenir finalement y = 129 et o © 47,8. 
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3.15 


Soit X le taux d’alcool en pourcentage mesuré lors d’un alcootest. La va- 
riable aléatoire X à une distribution normale d’espérance 1 = 0,07 et d’écart- 
type o = 0,01. 

La proportion d’automobilistes recevant une amende est 


0,08 — 0,07 


P(X =1- 
(X > 0,08) ( oi 


) = 1-®(1) +0,16, 
et celle d’automobilistes se faisant retirer le permis parmi ceux ayant reçu une 
amende est 
P(X > 0,09N X > 0,08) 
PIX > 009! ZX > 008) = —- 
Ce DIE 08) P{X > 0,08) 
P(X > 0,09) 1 — (2) 


ER LS id 
P(X > 0,08) 1-—d(1) 


3.16 


Soit X la durée de grossesse. La variable aléatoire X suit une loi normale 
avec paramètres (270, 100). La probabilité que la conception de l’enfant ait eu 
lieu plus de 290 jours ou moins de 240 jours avant sa naissance est 

P(X > 290 ou X < 240) — 
=  P(X > 290) + P(X < 240) = (1 — P(2)) + (1 — H(3)) + 0,021. 


Dub 


Soit X la variable aléatoire représentant la vitesse mesurée. Cette variable 
aléatoire suit une loi normale (72, 64). 
1. La proportion de conducteurs qui recevront une amende est égale à la 
probabilité que X soit plus grand que 80, soit 


80 — 72 


PIX > 80) = P (2 > }=1-80=16% 
Z suivant une loi normale centrée et réduite. 

2. On cherche la probabilité conditionnelle de mesurer une vitesse supérieure 
à 110 en sachant que le conducteur est déjà passible d’une amende. On 
calcule donc 

P(X > 110N X > 80) 

P(X > 80) 
P(X > 110)  1—%(4,75) à 
P(X > 80) 1-61) 


P(X > 110 | X > 80) 


Il 


La probabilité est presque nulle. 
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3.18 


La fonction de répartition de Y est 


Fy(y) = P(Y < y) = P(X? < y) = 
= P(-/y<X </y) = Ex(-9) — Fx(9). 


Dérivons par rapport à y pour obtenir la densité 


D = pa à VD = a (V 


où, dans la dernière égalité, on a utilisé la parité de la fonction de densité de 
la loi normale. Finalement, on trouve la fonction de distribution (illustrée par 
la figure 3.3) 


Jr (y) = = (-5) . 


+ 
eo 
S 
SE 
o 
T T T T T T T 
0.0 0.5 1.0 1.5 2.0 2.5 8.0 
y 


Fig. 3.3 — Fonction de distribution d’une variable aléatoire y? à 
un degré de liberté (exercice 3.18). 
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3.19 


La variable aléatoire V suit une loi uniforme sur l’intervalle (0,1) et on 
cherche la fonction de répartition de W = —+In(V) 


Fw(w) = P(W <w) = P (jun) < w) = P(V > exp(—w)) 


1— Fy(exp(—Aw)) = 1 — exp(Aw), 


si w > 0 et O0 sinon. La variable aléatoire W suit une loi exponentielle de 
paramètre À et sa densité est 


__f Aexp(—Aw) si w >0 
Jw(w) = { 0 sinon. 


3.20 


Soit Y = (X/a)°, où X suit une loi de Weïibull. La fonction de répartition 
de Y est 


8 
Fy(y) = P(Y <y) = P (à) <1) = P(X < ayl/8) = Fx(ayt/8), 


et sa fonction de densité 


fr (y) CES 
— ee oi ee (- (a) 
B a a a 
y). 


La variable aléatoire Y suit une loi exponentielle de paramètre À = 1. 


Il 


Del 


La variable aléatoire X suit une loi y? et sa fonction de répartition est (voir 
l'exercice 3.18) 
Fx(x) = 26(Vx 
La fonction de répartition de Y = log(X 
Fy(y) = PY < y) = P(log(X) < y) = 
= P(X <exp(y)) = Fx(exp(y)) = 2 (exp(y/2)) — 


et sa fonction de densité 


7 


—1, æ>0. 


est ainsi 


— 


Fr = éleplu/2))eplu/2) = exp (5e +2) 
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où ® est la fonction de répartition et 4 la fonction de densité d’une variable 
aléatoire normale centrée et réduite. 


3.22 


1. L'égalité suivante doit être vérifiée 


ce qui implique 


_ 1 
E JE x dx 
L'intégrale s'écrit 
* l ne 1 
[l x dx — xl = pre 
5 1-a 428 a—l 


Il faut que à > 1 pour que la fonction de répartition reste positive. On 
trouve par conséquent 
k=(a—1)5%"t, 


2. Calculons la fonction de répartition de X 


æ t=x a—1 
: t=5 T 
pour æ > 5. 


3. Soit Y = In(X/5). Sa fonction de répartition est 


X 
Ey(y) = P(Y <y)=P (in (5) < ) 
=  P(X < 5e) = Fx(5e*) = 1—exp(—-y(a—1))}, y >0 
et sa fonction de distribution 
fr(y) = (a—1)exp(—-y(a—1)), y>0. 


La variable aléatoire Y suit une loi exponentielle de paramètre a — 1. 


3.23 


La variable aléatoire X suit une distribution de Pareto et on cherche la loi 
de la variable aléatoire Y = In(X) = g(X). On utilise la formule de changement 
de variable pour transformations monotones 


BG = PQ) EE 


= ax exp(—y(1 + à))exp(y) = aexp(a(yo — y)), 


avec y > yo = log to. 
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3.21 


Soit Z — 1/V une nouvelle variable aléatoire dont on aimerait connaître la 
distribution. Sa fonction de répartition est 


mO=PG<a=P(g<:)=P(v>5)=1-r (5). 


On dérive cette fonction pour obtenir la densité de Z 


fz(e) = =fv (:) (-2) : FT = TT 


La variable aléatoire Z est aussi une variable aléatoire suivant une loi de Cauchy. 


3.25 


On va s'intéresser à la variable aléatoire S — L2. 
1. La fonction de densité de $ peut être calculée à partir de la fonction de 
répartition de S 


Fs(s) = P(S < s) = P(L? < 5) = P(L < VS) = Fr(Y5s) 


+ 159 = alu(V9 = GVS(1- V5)=3(1- V5), 0<s<1 


2. L’espérance de S est alors 


1 
2V5s 


E(S) = [sis = [as - vous 8 [270 


s=1 


Il 

[2ù) 
RS 
NI 

a 

ND 

| 
OU ND 

a 

ot 

Brie 

ND 
V2 


3.20 
1. Trouvons la fonction de répartition de $ — 4rR?: 


Fs(s) = P(S<5s) = P(4rR? < 5) 


P(R< TE) Re (JE). 


Sa fonction de densité est donc 


1 


S 
S 


= ——|3-,/— |), 0<s< 367. 
= =) 
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2. Calculons l'espérance de S 


367% 1 367 83/2 
re 35— d 
ROUE 7 (ss =) . 


2: ue ns, 
: 54/9 5 


E(S) 


FAT 


La variable aléatoire X à une fonction de répartition Fx(x). Soit Y — 
Fx(X) une nouvelle variable aléatoire. Sa fonction de répartition est 


Ey(y) = P(Y < y) = P(Fx(X) < y) = P(X < Fx(y)) = Ex(Fx (y) = y, 


pour 0 < y < 1. Par conséquent, la variable aléatoire Y a une distribution 
uniforme sur l'intervalle (0, 1). 


3.28 


Soient T'la durée de vie d’une pièce et P l’événement « la pièce est piratée ». 
On sait que P(P) = 1/4, que T | P suit une loi exponentielle avec espérance 5 
et que T | P suit une loi exponentielle d’espérance 2. En sachant que la pièce 
a survécu jusqu’au temps t, la probabilité qu’elle soit piratée est 


P(T >t|P)P(P) 


AO = PPT ER ER RE _— 
P(T > t| P)P(P)+ P(T > t| P)P(P) 
_ _ chi 
Re ere 
- 1 
__ 1+3eñt 


car 


PT sûre À Xe “dt, 
t 


avec À = 3 où À = à (cf. exercice 3.4). Lorsque t tend vers l’infini 


lim r(t) = 0. 


t— 00 


9.29 


Soit X la position du point sur le segment. On suppose que X suit une loi 
uniforme (0, L). Pour que le rapport entre le plus petit et le plus grand segment 
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soit inférieur à 1/4, il faut que X/(L — X) < 1/4 ou (L — X)/X < 1/4. On 
trouve alors la probabilité 


X 1 L—X 1 L AL 
P — | = PIX <— PIX > — 
GS <s = <5) ( <2)+ ( >=) 
L/5 AL/5 2 
L + ( F ) 5 
3.30 
1. On suppose que le risque est constant : 
reed S(t) 
D 73 Ôt 8 , 


donc 
=M=loSftj+C & S(b=e "6, 


On trouve alors la fonction F(t) suivante 

FD=TsES 
Pour que F(t) soit une fonction de répartition, il faut imposer C = 0 pour 
que F(0) = 0. La fonction F(t) se trouve être la fonction de répartition 
d’une loi exponentielle de paramètre À. 


D À présent, on cherche la densité de la fonction de survie des malades si 
la fonction de risque est 


ht) = Ak(X)° 1. 
On calcule une primitive H(t) de la fonction À(t) : 
H(t) = (A) +C 


et on en déduit 


S(t) = exp(—(Àt)" — C). 


Comme précédemment, on impose € = 0 pour obtenir la fonction de 
répartition 
F(t) = 1-exp(—-(Xt)") 


et la fonction de densité correspondante 
FE) = AK(XE)" L'exp(—(At)"). 


Cette fonction est celle d’une variable aléatoire suivant une loi de Weibull. 
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Ho 
1. Soit S(t) = P(T > t) et À(t) = —< log S(#). 
Donc S(t) = exp ( —  A(s)ds). Dans notre cas 
0 


t t 
ds a+t 
ds = | —— =] 
fre ‘ Je o8 ( a ) 
0 0 


et S(t) = +. 
2. Puisque S(t) = 1 — F(t), la médiane est la valeur de t qui résout 
CS | 
a+t 2? 


c’est-à-dire { = a. 

3. Le paramètre a est le temps de passage à des probabilités de survie su- 
périeures à 50 %. 

4. Par le théorème des fonctions inverses 


t 
Fr(t) = 1— S({t) = = 
0) = ——=u 
pour t > 0. Donc 
ae AU; 
: l—u; 
pour i=1,...,n. 
3.32 


La demande journalière de journaux X suit une distribution normale de 
paramètres (100,200/3). 
1. Le bénéfice B en centimes s'écrit 


B=— 5s si À >s 
7 | 5X —-10(s—-X) sinon. 


L’espérance de B est alors 


ED = | Be 1062) x(ode +] Cr. 


— OO 


Il 


5[. bide 106 f PU Le nf" Paye 


S 


5s—155Fx(s) + 15 / xfx(x)dx. 


— CO 


Il 
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2. On cherche à présent la valeur $ = sax qui maximise E(B). On utilise 


0 S 
5 ” xfx(x)dx = sfx(s) 
pour calculer la dérivée par rapport à s de E(B) 
OE(B 
220) = 5 — 15(FX (5) + sfx(s)) + 15sfx(s) = 5— 15F% (5). 


La valeur sax est la solution de 0E(B)/0s = 0, donc 


1 
5 —15Fx(Smax) =0 + Fx(8max) = 3; 


et finalement 


Smax — 100 1 Smax — 100 
———— | = ES ——— —- 043 €  Smar © 97. 


3.33 


Commençons par la fonction de répartition de Y 
Fy(y) = P(Y < y) = P(min(X;) < y) = 1 — P(min(X;) > y). 


Si min(X;) est supérieur à y, cela signifie que le plus petit des X; est supérieur 
à y, ou encore que tous les X; sont plus grands que y. Par conséquent, 


Fy(y) =1-(P(X1 > y) =1-(1-Fx(y))" =1-(1-7y)". 
En dérivant Fy(y) par rapport à y, on a la fonction de densité de y, à savoir 


fr) =n(i-yt, 0<y<l1. 


3.31 


1. Étant donné l’indépendance de X,,...,X,,ona 
Fr(t) = P(T<t)= P(max(X1,...,X») <t) 


P(X1 <t,X2 <t,..., Xn <t) 
= (PC <t))} = (Fx())7. 


2. La densité de T est donnée par fr(t) = £Fr(t) = n(Fx(t))" 7 fx(t). 
En utilisant la définition de fx(x) et 


0 zx <0 
7 0<r<0 
1 x>6, 


7 
E 
I 
RS 
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on obtient 


Enfin 


0 t=0 
__ 2n En gt = 2n [ +1 
| g2 _ @2n \2n+1 
0 t=0 
: 2n 
 2n+1 
3. On calcule la probabilité 
1 a < 0 
P(T > a)=1-Fr(a)=4 1-(4)" 0<a<0 
0 a > 


3.39 


Le prix de l’action dans 10 jours s'écrit 
11 
Yu = Yo + Uni = Y1 + JU. 
i=2 


Son espérance est alors 


11 11 
E(Yu)=E Ë +N ni) = 100+ Ÿ_ E(U;) = 100 
i=2 i=2 


et sa variance 
11 


var(Ÿ11) = var(Y1) + Ÿ_ var(U:) = 10 
i=2 
car tous les U; sont indépendants. La probabilité que l’action soit comprise 
entre 95 et 105 dans 10 jours devient 
P(95 < Y11 < 105) = P(| Y11 — 100 |< 5) = 1 — P(| Y11 — 100 [> 5), 
or, par l’inégalité de Chebychev 
10 
Donc 
P(95 < Y11 < 105) > 1 — 0,4 = 0,6, 
c’est-à-dire qu’il y a 60 % de chance que le prix de l’action se trouve entre 95 
et 105 dans 10 jours. 
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3.30 


Soit X une variable aléatoire suivant une loi de Dagum. 
1. La fonction de densité de X est la dérivée par rapport à x de la fonction 
de répartition, soit 


faste) = RD 2 pad (1 4 ed) 
T 


avec x > (. 


2. On cherche premièrement l’équation d’un a-quantile g, pour la loi de 
Dagum 


a=(1+XS)É ee qa=X/(a 1/8 1)-1/6, 


\ 


À l’aide des données de l’énoncé, on obtient 
| 


d,5 T 140,4 
do,25 © 92,5 
d0,75 TT 206,3. 


L’espérance n’est pas égale à la médiane parce que la distribution n’est 
pas symétrique. 

3. L'emploi de la loi normale est inadapté dans ce cas car la distribution des 
revenus est asymétrique, à l’inverse de la loi normale. 


4. Soit y = 0,8x et sa fonction de répartition 
Ep x (y) = (14 (0,8) 7°) 7 = (140,8 0x2 5) = (14 Na) 7, 


où X = 0,8 x, = Bet 5’ = 6. Donc, À est un paramètre d'échelle. 


3.97 


On sait que si une variable aléatoire X a une fonction de répartition Fx(x), 
alors la variable aléatoire Y définie comme Y = Fx(X) suit une loi uniforme 
sur l'intervalle (0, 1) (cf. exercice 3.27). Dans le cas présent, on dispose déjà d’un 
échantillon d’une loi uniforme (0,1), donc de réalisations de Y, et on cherche à 
obtenir des réalisation d’une loi de Dagum. On définit alors X = F-1(Y) avec 
F la fonction de répartition de la loi de Dagum calculée dans l'exercice 3.36. 
En d’autres termes, on calcule les quantiles de u1, ...,u30 


Qu = AVS (ur V8 — 1) V8, 
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3.38 
1. On à que (M — 3) + e(À), avec À = +. Cela implique E(M — 3) = + et 
var(M — 3) = 5. Dans notre cas E(M) =2+3 =5 et var(M) = 4. 
2. La fonction de densité est f(m) = Xe "-3) pour m > 3. 


3. Par la formule du changement de variable (transformation monotone), la 
densité de X = exp(M) est donnée par 


fx) = farm): = Xe M()-31 


= eg OH), pour x > eÿ. 


La fonction de répartition de X est donnée par 


f Xe —(A+D q a ex À x > e? 
He J y y - 


0 sinon. 
4. La plus faible magnitude est définie par min(W, M) et 


P(min(Mi, M)>4) = P(M>4et M >4) 
P(M > 4)P(M: > 4) 
= ee =" es 030: 


Il 


5. Par le théorème des fonctions inverses (cf. exercice 3.27) on au = Fx(x) = 


3 
1—e%x À et donc x; = 


e° NE. 
no lan 


3.39 


On commence par isoler Ron de l'équation de l’énoncé 


n l/n n 
1 
Ron = [[( Se) 1e (Si (È )}-1=e-1 


t=1 


Par hypothèse 


et par conséquent Y = W{u,02/n), ou encore eŸ suit une loi log-normale 


d'espérance y et de variance o?/n. On trouve dans les tables 


o? 
E(Ron) = exp (2 + a) ou 
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ia 0? 
var(Ron) = EXP (2 (2 + z)) — EXP (20 + z) : 
n n 


Lorsque n — oo, E(Ron) = u et var(Ron) = 0. 


et 


Chapitre 4 


Variables aléatoires 
multivariées 


Introduction 


Ce chapitre est consacré à l’étude des variables aléatoires multivariées. On 
discute les outils qui permettent de formaliser le comportement du point de 
vue probabiliste de plusieurs variables aléatoires simultanément. Les notions 
de base sont la distribution conjointe, la distribution marginale, la distribution 
conditionnelle et l’espérance conditionnelle. Ces concepts sont présentés dans les 
exercices 4.1 à 4.3 pour le cas discret et dans les exercices 4.4 à 4.11 pour le cas 
continu. On trouvera des exercices qui présentent le calcul d’intégrales doubles, 
un outil mathématique nécessaire pour calculer des probabilités conjointes. 

La loi normale multivariée est discutée dans les exercices 4.12 à 4.14. 

Les notions de covariance et corrélation sont traitées dans le cadre du cal- 
cul de la distribution d’une combinaison linéaire de variables aléatoires (exer- 
cices 4.15 à 4.20). Un cas intéressant dans le domaine de la finance concernant 
le choix d’un portefeuille d’actifs financiers est discuté en détail dans l’exer- 
cice 4.17. 

Enfin la dernière partie (exercices 4.21 à 4.25) est consacrée à une série 
d'exercices plus complexes qui font appel à l’ensemble des concepts étudiés 
dans ce chapitre. 


Références (théorie) 


Ross, chapitres 6 et 7 [1] et Pitman, chapitres 5 et 6 [2]. 
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Exercices 


Lois conjointes, marginales et conditionnelles 


4.1 


On lance 3 fois une pièce de monnaie. Définissons X la variable aléatoire qui 
compte le nombre de piles et Y le numéro du lancement qui donne face pour 
la 1° fois. (On pose Ÿ = 0 si l’on n'obtient pas de face en 3 jets.) Trouver les 
probabilités P(X = i,Y = j) pour (4,3) € {0,1,2,3} x {0,1,2,3}. Constater 
que + P(X =i,Y =3j)=1. 


4.2 


Soit X un chiffre choisi aléatoirement parmi les entiers 1, 2, 3, 4. Soit Y 
un autre chiffre choisi aléatoirement parmi les chiffres au moins aussi grands 
que X, mais inférieurs ou égaux à 10. 

1. Trouver la loi de probabilité de X et la loi de probabilité conditionnelle 

de Y | X = x pour tout x € {1,2,3,4}. 

2. Déterminer la loi de probabilité conjointe de (X, Y). 


4.3 


Je viens d'ouvrir une loterie écologique. Les clients en ont en effet assez de 
ces systèmes informatiques compliqués auxquels ils ne comprennent rien. Ii, il 
s’agit seulement de lancer une paire de dés ordinaires, après avoir payé 10 €. 
On note le plus petit des 2 résultats (ou le résultat unique en cas d’égalité). Si 
c’est 1 ou 2 on perd les 10 €. Si c’est 3 ou 4, on rejoue. Si c’est 5 ou 6, je donne 
une excellente bouteille de champagne, qui me revient à 50 €. Comme vous 
l’imaginez, la simplicité de mon système de loterie fait fureur (ainsi que son 
appellation écologique) et je gagne en moyenne 1 000 € par jour. À combien 
de lancers de dés par jour cela correspond? 


4.4 


Les variables aléatoires X et Y ont la densité conjointe 


YU sir>lety>0 
sinon. 


J(æ,y) = { : 


1. Calculer P(X?Y > 1). 
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2. Calculer les densités marginales fx(x) et fy(y). 
X et Y sont-elles indépendantes ? 


4.5 


Les variables aléatoires X et Y ont la densité conjointe 


_ [ 2zy+ y? 0O<z<1,0<y<1 
f(x, 9) = { 0 sinon. 


Vérifier que f(x, y) est une densité. 
Trouver les densités marginales fx(x) et fy(y). 
Trouver les densités conditionnelles fx,y=,(x) et fy1x=x(y). 
Calculer P((X, Y) € [0, à] x [0, 4). 
Trouver P(X < Y). 
Trouver E(Y | X = x). 
Soit la variable aléatoire Z = E(Y | X). 
(a) Quelle est la distribution de 77? 
(b) Trouver E(Z). 


SN US RD CE 


4.6 (Problème de Buffon) 


Sur un plan on trace des droites parallèles distantes d’une unité de longueur. 
On y jette au hasard une aiguille de longueur 1. On repère l'aiguille grâce à la 
distance X entre le milieu de celle-ci et la parallèle la plus proche et grâce à 
l’angle 8 entre l’aiguille et une perpendiculaire aux lignes. On suppose que X 
suit la loi uniforme sur (0, 1/2), que © suit la loi uniforme sur (0,7/2) et que X 
et 0 sont indépendants. Donner la loi du couple (X, 4) et trouver la probabilité 
que aiguille rencontre une des droites (l'alternative étant que l’aiguille soit 
complètement située dans une des bandes délimitées par les lignes). 


4.7 


Marine et Laure se sont données rendez-vous à l’Arena à 20 h 30 environ. 
Si Marine arrive entre 20 h 15 et 20 h 45 et si Laure arrive indépendamment 
entre 20 h 00 et 21 h 00, trouver la probabilité que celle qui arrive en premier 
n’attende pas plus que 5 minutes. Quelle est la probabilité que Marine arrive 
en premier ? (On considère que les arrivées sont uniformément distribuées.) 


4.8 


Selon l’horaire, un train doit arriver à la gare à 12 h 00 et la quitter à 12 h 07. 
Le retard X, en minutes, de l’arrivée à la gare est uniformément distribué sur 


84 Maîtriser l’aléatoire 


l'intervalle (-2, 3). Le temps de stationnement à la gare Ÿ est indépendant de X 
et est uniformément distribué sur l'intervalle (3, 5). Le train ne quitte jamais 
la gare avant 12 h 07. Trouver la fonction de distribution de Z, le retard avec 
lequel le train quitte la gare. 

Indication : exprimer Z en fonction de X et Ÿ et utiliser une représentation 
graphique dans le plan (+, y). 


4.9 


La densité conjointe des variables aléatoires X et Y est donnée par 


__ fe ve-Y/y si0 <x < 00, 0 < y < 00 
f(&,9) = { 0 sinon. 


Calculer P(X > 1|Y = y). 


4.10 
La densité conjointe de X et Y est donnée par 
3V3 3 
f(æ,y) = _ exp|—5(r +y-2)|, (my) ER. 


1. Trouver les densités marginales fx(x) et fy(y). 
Indication: utiliser les propriétés de l’intégrale d’une densité normale. 
2. Les variables aléatoires X et Y sont-elles indépendantes ? 


Cu 


Trouver la densité conditionnelle fx}y (x | y). 
4. Calculer E(X | Y = y). 
Quelle est la distribution de la variable aléatoire E(X | Y )? 


4.11 


Soient X et Y les scores à 2 examens. Les données historiques montrent une 
dépendance entre X et Y qui est modélisée par la densité bivariée 


1 [2 : 
_[ et +zy), si0 <x <6 et 0 <y<6 
fax (y) = { 0 sinon. 


Trouver la densité marginale fx (x). 

Trouver la densité conditionnelle f;,x(y). 

Calculer P(X < Y). 

Calculer le meiïlleur prédicteur E(Y | X) et donner son espérance et sa 
distribution. 


SO 
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Loi normale multivariée 


4.12 
Soit X1,...,X, n variables aléatoires indépendantes de loi W(0,1). 
1. Trouver la densité conjointe f(x1, ...,2n) de (X1,..., Xn). 


2. Représenter les courbes de niveau (pour le cas n = 2) f(x1,2%2) = C. 


4.13 


Les ventes annuelles du rayon jouets d’une grande surface sont représen- 
tées par une variable aléatoire normale X d’espérance gx et de variance 0%. 
Le bénéfice l’est par une variable aléatoire normale Y d’espérance y et de 
variance 0%. Le paramètre pxy désigne la corrélation entre les ventes et le 
bénéfice. 

1. Si les ventes s'élèvent à un montant x, quelle est la densité de probabilité 

du bénéfice ? 

2. Quelle est la densité de E(Y | X)? 


4.14 


Supposons que l’indice Dow Jones, noté D, soit une variable aléatoire dis- 
tribuée selon la loi W(v,T7?). Soit S le Swiss Market Index. La densité condi- 
tionnelle de S sachant que D = d est une loi normale d’espérance d et de 


variance 02. 


1. Quelle est la distribution conjointe du couple (D, S)? 
2. Quelle est la distribution conditionnelle de D sachant que S = 5? 


3: À partir de données historiques on connaît les valeurs de v, 7 et o. Ayant 
observé une valeur s pour le Swiss Market Index, calculer le meilleur 
prédicteur pour l’indice Dow Jones. 


Combinaisons linéaires de variables aléatoires 


4.15 


Soit S une variable aléatoire binomiale de paramètres n et p. Représenter S 
comme une somme de variables aléatoires indépendantes et calculer l’espérance 
et la variance de S. 
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4.16 


La variable aléatoire S = 577, X; est une somme de variables aléatoires 
indépendantes de même distribution. Calculer son espérance, sa variance et sa 
distribution lorsque: 

1. chaque X; suit une loi de Poisson de paramètre À); 

2. chaque X, suit une loi Gamma de paramètres À et k. 


4.17 


On considère un portefeuille avec 2 actifs. Son rendement R, s'exprime 
comme combinaison linéaire des rendements À. et R2 des 2 actifs: R, = a1R1+ 
(1 — a)R2. On connaît les rendements moyens y et u2, les risques o1 et 02 et 
la corrélation entre les 2 actifs p12. 

1. Exprimer le risque o, du portefeuille en fonction de la proportion a1 du 

premier actif. 

2. Quelle doit être la proportion a1 du 1” actif pour que le risque du porte- 

feuille soit minimal ? 

3. On note y, le rendement moyen du portefeuille. Exprimer o, en fonction 

de Up. 

4. Cas particulier : u1 = 14 %, po = 8 %, o1 = 6 %, 02 =3 %. 

Pour p12 = 0, on a le tableau suivant : 


Ca] 000 020 [00 | 060] 030] 1:00 


ur] 5.00 
Cor [300 [26 f 5007 500 2m 600 


Faire des tableaux semblables pour p12 = 1,0,5 et —1. 


5. Représenter les courbes des portefeuilles possibles dans l’espace des ris- 
ques et des rendements moyens. Par convention dans ce domaine, o, est 
en abscisse et u, en ordonnée. 


4.18 


Le nombre de clients se rendant à un grand magasin donné dans l’espace 
d’une journée est une variable aléatoire suivant une loi de Poisson de para- 
mètre 50. La somme dépensée par chacun des clients quotidiens du magasin est 
une variable aléatoire d'espérance 8 €. On admet que les dépenses d’un client 
ne dépendent ni de celles des autres clients, ni du nombre total de clients pour 
la journée. 

Quelle est l’espérance du chiffre d’affaires quotidien du magasin ? 
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4.19 


Soient X et Ÿ 2 variables aléatoires mdépendantes telles que X = Büin(n, p) 
et Y = Bin(m,p). On définit Z = X +Y. 

1. Quelle est la distribution de 77? 

2. Quelle est la distribution de X | 7? 

3. Trouver E(X | Z). 


4.20 


Soient X et Ÿ 2 variables aléatoires indépendantes de loi {{(0, 1). Quelle est 
la densité de X + Y ? 


Exercices combinés 


4.21 


Soit À une variable aléatoire binaire qui représente « l’état d'incertitude sur 
la scène internationale ». Supposons pour simplifier que X ne puisse admettre 
que 2 états notés N (« situation normale ») et Æ (« situation exceptionnelle », 
comme par exemple une guerre ou un attentat). Soit P(X = N) = 0,95. De 
plus, on considère le rendement R d’un actif financier qui suit le modèle sto- 


chastique 
52 
log(R) = 72 Te oŸ, 


où & > 0 et Y est une variable aléatoire dont la distribution conditionnelle 
sachant {X = N} est W(0,1), et sachant {X = E} est W(0,5?). 
1. Interpréter ce modèle: quel effet veut-on capturer avec la distribution 
conditionnelle postulée ? 
2. Calculer l’espérance et la variance de Y. 
3. En utilisant le point 2., déduire l’espérance et la variance de Z = log(R). 
4. Écrire la densité fy(y) de Y et, en utilisant le fait que la somme de 2 va- 


riables aléatoires normales reste une variable aléatoire normale, donner 
la distribution de Y. 


5. Montrer que À suit la distribution 
f 1 e-Qogr+)?/(440?) 
D) = ———@ ———|, 
# /4,4To2 r 


c’est-à-dire la loi log-normale de paramètres (—a?/2, 2,20?). 
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4.22 


Pour chaque automobiliste, les compagnies d'assurance déterminent un in- 
dicateur B de qualité de conduite qui est lié à la classe de bonus de l’automobi- 
liste. Des petites valeurs de B caractérisent un bon automobiliste qui se trouve 
dans une classe à bas risque. 

Des études actuarielles indiquent que la distribution de la variable aléatoire B 
dans la population des automobilistes d’une certaine région est une distribution 
exponentielle avec espérance 0,1. 

Soit N; le nombre d’accidents durant l’année à (à partir de la date de l’obtention 
du permis de conduire) pour un automobiliste donné. Le nombre annuel d’ac- 
cidents causés par un automobiliste, étant donné B = b, suit une distribution 
de Poisson de paramètre b. On suppose aussi que, étant donné B = b,ily a 
indépendance entre le nombre d’accidents causés par un automobiliste durant 
une certaine année et ceux des années suivantes ou précédentes. 

1. Quelle est la probabilité qu’un automobiliste tiré au hasard n’ait aucun 

accident pendant les 3 premières années d’observation ? 

2. On observe un automobiliste tiré au hasard. Soit ÆX la variable aléatoire 

qui désigne la 1" année pendant laquelle cet automobiliste cause un acci- 
dent. Déterminer la loi de K, c’est-à-dire P(K = k) pour k = 0,1,2,... 
3. Déterminer l’espérance conditionnelle E(K | B). 


4.23 


On s'intéresse à évaluer la qualité des investisseurs institutionnels. On mo- 
délise celle-ci à l’aide d’une variable aléatoire X à 4 modalités (1, 2, 3, 4): 
&« 4 = très bonne connaissance du marché », « 3 — bonne connaissance du 
marché », « 2 — faible connaissance du marché » et « 1 — aucune connais- 
sance du marché ». Pour comprendre la répartition des investisseurs entre ces 
4 classes, on connaît la différence entre les prévisions données par un groupe 
d'investisseurs et la valeur réelle du marché mesurée par le Dow Jones et le 
Nasdaq. On notera D la variable aléatoire représentant cette différence entre 
le Dow Jones et la prévision d’un investisseur donné et N entre le Nasdaq et 
la prévision de ce même investisseur. On suppose que D suit une loi normale 
avec espérance 10 (unités en 10%$) et variance 2, et N une loi normale avec 
espérance 3 et variance 1. Enfin, soit Y («) la variable aléatoire qui représente 
la somme pondérée des différences entre les prévisions et les valeurs réelles, 
c’est-à-dire Y (a) = aD + (1 — a)N, où a est un coefficient positif connu. 

1. Calculer la distribution de E(Y(a)) et var(Y (a)) en sachant que la cor- 

rélation entre D et N est 0,8. 

2. Trouver la distribution de Y (a) en supposant pour simplifier que D et N 

sont indépendantes. 

3. En utilisant le point 2., calculer la densité de la variable aléatoire Z — 

exp(—Y (a). 
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4. De plus, on connaît la relation entre X et Y(a) à travers la distribution 
conditionnelle de X | Y (a). 


où z = exp(—y). 
En utilisant 3., calculer E(X). 

5. Quelle est la probabilité que l’investisseur institutionnel ait une très bonne 
connaissance du marché? 


4.24 


Une compagnie pétrolière a décidé de forer dans 10 localités. La probabilité 
de trouver du pétrole dans une localité est seulement de 1/5, mais si du pétrole 
est trouvé, alors le profit P; de la compagnie par la vente du pétrole d’une 
localité à (en excluant le coût du forage) suit une loi exponentielle d'espérance 
5 Mioe€. 

Soit N la variable aléatoire qui représente le nombre de localités où l’on trouve 
du pétrole et Z la somme des profits tirés des ventes du pétrole de chaque 
localité. 


1. Exprimer la variable aléatoire Z en fonction de N et des P. 
2. Calculer P(Z > 10Mio| N =1)et P(Z > 10Mio | N = 2). 
3. Trouver E(Z | N =n)et E(Z). 
4. Est-ce que la probabilité d’avoir un profit supérieur à 20 MioÆ€ en vendant 
le pétrole est plus grande que 1/2? 
4.25 


Une compagnie d’assurance modélise les montants de dédommagements lors 
d’accidents comme des variables aléatoires indépendantes D, Do, ... suivant 
une loi exponentielle avec espérance 1/y, avec u > 0. En outre, le nombre d’ac- 
cidents N(t) dans un intervalle de temps [0,t] est modélisé selon une variable 
aléatoire de Poisson P(At), avec À > 0. 

Soit S — pie) D; le montant total des dédommagements dans l’inter- 
valle [0, t]. 

1. À l’aide du théorème central limite, donner une approximation de la dis- 

tribution conditionnelle de S | N(t). 


2. Calculer l'espérance et la variance de S. 


3. Exprimer la densité de S en fonction de la densité conditionnelle de 
S | N(t) et de la loi de probabilité de N(#). 
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4. Pour prévoir ses réserves, la compagnie doit connaître la probabilité que S 
excède une certaine limite s0. Exprimer P(S > 50) à l’aide de la fonction 
de répartition de la distribution normale centrée réduite. 

Indication : utiliser le point 8. 
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Corrigés 
JA 


Après avoir dénombré toutes les possibilités, on représente les probabilités 
de chaque occurrence des couples (X, Y) dans le tableau suivant. 


pe el 
= __0 | 178 | 178 | 


= 5 | 5. 
ere Eu 
= o Lies) 0 | 1%. 
CP=sf 0 [Lo [if 0 | 14. 
mel) : | 


Par exemple 
P(Y =1,X=1)=P(FPF ou FFP), 


où F'et P représentent respectivement un tirage « face » et « pile ». On retrouve 
les lois marginales de X et Y dans la ligne et la colonne « somme ». 


1.2 


1. La loi de probabilité de X est 
1 
P(X=2)= 7, x € {1,2,3,4}, 
et celle de Y | X = x 


10—(x—1)" 
2. La loi de probabilité conjointe de X et Y est obtenue par la relation 


P(X =xY =y)=PY=y|X=x)P(X =x), y>x, r€1,2,3,4. 


Sous forme de tableau récapitulatif, cela donne : 


ROSRRSESNSE MERE EURE TUE 


DT 0 is free [786 [1786 1/86 [86 | 1786 [1/80 | 1/56 
D=3f 0 [0 [i9/182/1/8)1/82[1/8 | 1/82 [1/82 [1/8 
Gif Do to Desfies [ie (res (res [1 [128 
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1.3 


Soit X la variable aléatoire qui correspond au résultat du 1” dé et Y celle 
qui correspond au 2°. Sous forme de tableau, mes gains sont: 


SX = 


Chaque occurrence arrive avec une probabilité de 1/36. Par conséquent, l’espé- 
rance de mes gains sur 1 lancer est la somme du tableau divisée par 36 


1 10 


E(G) = 35 (10:20 +0:12—40-4)= =. 


Pour n lancers, l’espérance devient 


1 
E(gain total) = nE(G) = + 


et comme on cherche n tel que le gain total soit égal à 1 000, on trouve n = 900. 


44 


1. Le domaine d'intégration est défini par les relations X?Y > 1, X > 1 et 
Y > 0. Autrement dit, on intègre y de 1/x? à l’infini et x sur tout son 
domaine. 


PRE). = . e 0) dx 


O0 1 y—Sœ 
= 1h (- exp) dx 
1 T =1/x? 
y 
con sc 
_ 1 —e ‘dx = —e 1 =e"t, 
1 Z &5, 
2. La densité marginale de X est 
00 1 Yy=00 
Be) = ['entrpas Sent) 22 +21 
0 T y=0 TZ 


Pour la densité marginale de YŸ, il faut intégrer une fonction de type 
gaussien (e* ). Pour y parvenir, nous allons faire apparaître la densité 
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d’une loi normale 


. Tu me —x?y)dx 
fr(y) = Î exp(—x par = VE | Fur p(—zy)dz. 


Dans l’intégrale figure à présent la fonction de distribution d’une variable 
aléatoire X* normale d’espérance nulle et de variance 1/,/2y. Par consé- 


quent 
ue EP sie ire > Va). 


où Z suit une loi normale centrée et réduite. Finalement 
T 
JG) = \ Fil —®(V2y)), y > 0. 
Comme fx(x)fy(y) £ f(x,y), X et Y ne sont pas indépendantes. 


1.5 


1. Afin de vérifier que f(x, y) est une densité, on l’intègre par rapport à x 
et y sur tout leur domaine 


1 pl 3 1 3 æ=1 
4 : (220 + hi) dxdy = | (au + ju) dy 
o Jo 2 0 2 æ=0 
1 2 3\ 1y=1 
3 ) (: y ) 
= FSU Ie ler = 1. 
} ( 2 2 2 / |y=o 


La fonction f(x,y) est bien une densité. 
2. La densité marginale fx(x) de X est 


1 
3 1 
fx) = | (aus So) dar O<zx<l, 
0 


et celle de Y 


1 
3 3 
= | (ar + 3e) de =u+ 5. Se 
0 


3. On trouve la densité conditionnelle fx}y=,(r) à l’aide de la relation 


f(x, y) 
fxiv =) = 
e. 40) 
Ainsi 7 
TL y 
= = 1. 
fxiy=y(x) 27 3y 5 0<x< 
Et, de la même manière, 
Axy + 3y? 
fezo(y) = TT À , D<y<l. 


2x +1 
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4. La probabilité que X et Ÿ appartiennent à l'intervalle [0, 1/2] x [0, 1/2] 
est 


P((X,Y) € [0,1/2] x [0,1/2]) — ae (2ru+ hi) dxdy 


1/2 3 æ=1/2 
- L'se)"s 
0 
1/2 1 3 
_ : RE) 
= Î (v+ 1} )u 
dev may et «1 
(ee +) 16° 


5. Pour obtenir la probabilité que Ÿ soit supérieur à X, on intègre sur le 
domaine suivant 


1 y Le 1 : sn 
0 0 0 
1 y=1l 
3 6) 
= 3 NS; dy = = 4 
j (e Le 2 ) U 8” 


6. Calculons l’espérance conditionnelle E(Y | X = x): 


1 1 2 
Axy + 3y 
ji Yfyix=2(y)dy = | y ———— dy 
0 0 


2x +1 
= 1 D 
7 2x+1 (Ge +5) 


T1 167+9 
_1225+1. 

7. Soit Z = E(Y | X = x). Puisque X est défini entre O0 et 1, le domaine de 

Z est [25/36,3/4]. 

(a) La fonction de répartition de Z est 


æ=0 


y=0 


T=Y 
dy 
æ=0 


yo 8 


EY|X=7x) 


y=0 


1 16% +9 
Fe) ) 


P(Z<2)=P(— 
REA) (Se . 

12: — 9 122 — 9 
PR EE 
(x< 5) (Re): 
et sa fonction de densité 

122—9N3 1 
fzU) (ie 


D on 3 (42-38 ,1 
7 8(2—-3z)2 (8 (2-32 2 


Il 


Il 
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Fig. 4.1 — Illustration de l'exercice 4.6. 


(b) L’espérance de Z peut se calculer de manière rapide pour éviter 
l'intégrale de fz(2) 


E(2) = E(E(Y | X)) = E(Y) = Î ( u 7) #= 7 


1.6 


Les lois marginales de X et 9 sont uniformes et leur fonction de densité sont 


2 
fo(8)=-—, 0<8< 
TT: 


et 


1 
fx(x) = 2, D<z<3. 


Les variables aléatoires X et 0 sont indépendantes et, par conséquent, la densité 


conjointe de X et 4 est 
4 
f(x,0) = —. 


T 

Au vu de la figure 4.1, il faut que l’hypoténuse du triangle en 4 soit plus 

petite que 1/2. De cette manière, l'aiguille chevauchera forcément la droite. On 
a donc la condition suivante sur X 


x 1 cos 0 
LA DE à 


——— < — 
cosû 2 


La probabilité que l’aiguille touche une droite est donc 


0 m/2  pcos0/2 4 
P Ce E Lo, à x Û ee) = | Î —drdb = 


r/2 æ=cos 0/2 r/2 2 | 2 O0=7/2 
- | 2 œ= | Ft 2 
0 7 0 7 


T 


æ=0 0=0 
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Fig. 4.2 — Domaine d'intégration de l’exercice 4.7. 


17 


Soient X» et XL les variables aléatoires donnant l’heure d’arrivée (en mi- 
nutes après 20 h 00) de Marine et Laure. Elles suivent des lois uniformes res- 
pectivement de paramètres (15,45) et (0,60). 


1. On cherche la probabilité que les 2 heures d’arrivée aient un écart inférieur 
à 5 minutes, soit 


|< 5) — 
RE P(Xm —5 < X1 < Xm +5) 


+ Tax 60 30 M dL, 


où le domaine de définition D correspond à l’aire hachurée représentée 
sur la figure 4.2. Aïnsi 


( L< 5) ne 
PO XL: — Xm l<5 —= [ ! — dx dx 
15 Jau—5 30 60 


[= 1800 —— (Tu + zu + 5)dtm 


— — d = — 
180 Î. . 
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Fig. 4.3 — Représentation graphique du retard du train de l’exer- 
cice 4.8. 


2. La probabilité que Marine arrive en premier est 


60 
1 
P(Xu < Xr = f” Î. re 
( hs 30 60 


1.8 


L'heure en minutes après 12 h 00 à laquelle le train quitte la gare est égale 
à la somme du retard X et du temps de stationnement Y. Or, cette somme 
ne peut pas être inférieure à 7 parce que le train ne part jamais en avance sur 
son horaire. Par conséquent, l’heure de départ sera égale à max(X + Y,7) et le 
retard Z 
Z = max(X + Y,7) — 7 = max(X + Y — 7,0). 


La figure 4.3 donne une représentation du retard dans le plan (x, y). 
Nous savons que le retard Z est supérieur ou égal à 0 et qu’il ne peut pas 
dépasser 1 minute car X + YŸ —7 < 1. La fonction de répartition de Z est alors 


0 si z < 0 
Fz(2) = P(Z<2)=4 P(X+Y -7<2) s0<z2<1 
1 siz > 1. 


Il faut donc calculer P(X+Y —7 < z) et nous allons utiliser un agrandissement 
(figure 4.4) de l’aire hachurée de la figure 4.3. Comme les distributions de X 
et Ÿ sont uniformes, le calcul de cette probabilité revient à faire le rapport de 
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Fig. 4.4 — Agrandissement de l’aire hachurée de la figure 4.3 de 
l'exercice 4.8. 


l’aire hachurée horizontalement (A:) sur l'aire du triangle (Ar — A1 + A2) et 
on obtient 
aire A: aire Ar — aire A) 


P(X+Y -7< — L 
Sas A aire ÀAr aire Ar 


— 22 1-12) = 2: 2. 


1.9 


Pour obtenir la probabilité conditionnelle de X | Y, il faut calculer la densité 
marginale de Y 


sue ff) (ame) 


et ainsi obtenir la densité conditionnelle 


œ, 1 
Jxir=1 (x) = . = 1 (=) , æ>0, y>0. 


La probabilité cherchée est donc 


T—O00 


æ=0 
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1.10 


1. Pour déterminer la densité marginale de X, on intègre la densité conjointe 
sur le domaine de Y 
F2 3 
fx(æ) = / re SP (36 tire 7) dy 


— CO 


= se exp (55) 1% exp (30 — ) dy. 


Dans la dernière intégrale, on complète le carré afin de faire apparaître 
la densité d’une variable aléatoire normale et on obtient 


ne) 
Torre ke D 
On voit donc que X + W(0,4/9). La fonction de densité conjointe est 


symétrique en x et y et il est donc inutile de calculer la densité marginale 
de Y ; c’est la même que celle de X 


3 9 ; 
fr (y) = No (5 ) Ô 
Ainsi, Y = W(0,4/9). 

2. On vérifie facilement que le produit des densités marginales est différent 
de la densité conjointe, ce qui signifie que les variables aléatoires X et Y 
ne sont pas indépendantes. 

3. La densité conditionnelle de X | Y = y s'écrit 


Be > Les) _ Rep (4 +7 21) 
. fr (y) ep (à) 
3 3 1 
- nf) 
3 


et par conséquent, X | Y = y x W(y/2,1/3). 

4. L’espérance de X | Y = y est directement donnée par le calcul précédent : 
elle vaut E(X | Y = y) = y/2. La variable aléatoire U = E(X | Y) = Y/2 
suit une loi normale d’espérance nulle et de variance 1/9. 
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ue 
1. La densité marginale de X est égale à la densité conjointe intégrée sur le 
domaine de Y 


6 
=. LL. 56 Les 
fx = | 756 (C + xy)dy = EE + 3x). 


2. La densité conditionnelle de Y | X = x est le rapport entre la densité 
conjointe et la densité marginale de X 

_1r+y 

| 6x+3 


fv1x=5(Y) 


3. On calcule à présent la probabilité que X soit inférieur à Y. On résout 
donc l'intégrale suivante 


PELLE PME 2 5 
P(X <Y)= ee 6 VS, en 
CE Î L[ 75 +2) o y Î 25367 Ÿ — 14 


4. Commençons par trouver l'espérance de Y | X = x 


6 6 2 
1 Ty + x +4 
EYIX == [ufr | 22 | 


On crée maintenant une nouvelle variable aléatoire Z = E(Y | X) définie 
sur le domaine |10/3,4[. La fonction de répartition de Z est 


Fg(2) =r2<2=P (st <:) = 


_4 nr. 
be men mn 
3—2 3—2 
On en déduit sa fonction de densité fZ(z) 


z — 4 d z — 4 27 z — 4 
fz() = fx (=) dz (=) TC 


Finalement 


1.12 


1. Comme toutes les variables aléatoires sont indépendantes, la densité con- 
jointe est le produit des densités marginales 


1 n/2 ve 
fesse) = (5) (54). 
i=1 
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2. L’équation f(x1,12) = C donne 
xi + 25 = —2log(27C) 


qui se trouve être l'équation d’un cercle centré sur l’origine et de rayon 


/—2log(27C) pour C < 1. 


1.13 


La densité conjointe de X et Y est 


1 1 _ T—UXx 
= — fr = = Set 
fx y (x, y) 27/5 EXP ( (x UX,y — Ly) ( )) ; 


YU —UY 
avec 
__ Ge OXOYPXY 
OXOYPXY o$ 
et 
1 — PxY 
DRE | ox (IP) Oxo (1—PXxy) | 
ne De LL — ÿ 
oxov(1—pry) Ty U—Pxy) 
1. On calcule fy,x=x(y) 
fxv (x.y) 
Îvix=a(y) = = 
YIX 2 ) fx(x) 
LT ES pee = ne 
ST exp ( JT —Ux,y — uy)E Le. )) 


Ts XP (- nu ux}?) 

il 1 (y — ay )? 

= a 
oyV2r(1—-p}y) (1 — p%y) 


22 (x px)(y — ny) + (1—(1- pXy)) | 


D) 
OY 


1 


ep) 1 (OR ons) | 
oy V27r(1—p+y) 2(1— pXy) OY OX 


et on voit que 


OY 
YIX<N (ur + net — ax), oÿ(1 — fs) : 
2. La variable aléatoire Z = E(Y | X) est définie par 


© 
Z= EU IX) = ur + par (X — ax). 
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Notons que X — px  N(0,a%) et que par conséquent 
OY 2-10 
UC — x) e N(0,0%pxy). 


Finalement 


Ze N{uy, OYPxy). 


4.14 


Nous savons que D = N(v,7°) et S | D = d=< N(d,o?). 


1. Calculons la distribution conjointe de S et D 
fs,p(s, d) = fs1p=a(s) fp(d) = 
1 1 1 1 
LL Es = d 2 a d = 2 
ro (red) en (run) 


: 1 1 te 1 1 2 sd dv v 
tigre Pole bat state 
1 2 1 5 o2? + T2 2 
+ - (| S(s—1) + ex — —5V + 75 (d—v) 
PCR RL 
22 2 = 2 
1 1 2 o2 + T2 2 
” 2xor (3 ts») He GEL. 
sv sv sd v? 
PRE) 


où 


et S = Nr, a? + T?). 
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. De même, on calcule la distribution conditionnelle de D| S=s 


fp,5(s, d) 
=8 S] = - 
En És(s) 
Ti EXP (-3 [= (d— 7? - 2060 4 15 v}]) 


1 1 1 
Fes oP (ie - n°) 


1 o2+7T2 1 o2 + T2 T 
an D RS A ee —— 
V2T O°T 2 O?T oVo?+r? 


: 1 o2+7T2 1o2?+72 a T2 2? 
À Ne a me door 


Par conséquent 


2 2.2 


DIS=sN(v+ - en 2). 


o2 + T2 o2+ T2 


. Le meilleur prédicteur est donné par l’espérance conditionnelle 


Tr? o? T2 


 — = y + ——— 3, 
Arret v) HT LT 


E(D|S=s)=v+ 


1.15 


Soient X1,.. 


variables, S = 5, X;, et par conséquent 


E(S)=E be xi) = D, E(Xi) = np, 


var(S) = >_var(x:) = np(l — p). 


1.16 


Notons ox(t) = E(et*) la fonction génératrice des moments d’une variable 
aléatoire X. On utilise pour cet exercice la relation 


ps(t) = (bx,(t))", 


.,Xn des variables aléatoires de Bernoulli indépendantes va- 
lant 1 avec une probabilité p. La variable aléatoire S est alors la somme de ces 
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où S = 5), X; et les X; sont indépendants. 
1. Si X, suit une loi de Poisson de paramètre À, sa fonction génératrice des 
moments est 


Xe? 
px) = DL = exp(A(e"! — 1)) 


k! 
k=0 
et celle de S 
ds(#) = exp(nA(e"! — 1)). 
On voit que ps(t) est la fonction génératrice des moments d’une variable 
aléatoire de distribution de Poisson avec paramètre nÀ. Ainsi, E(S) = 
var(S) = nÀ. 
2. La fonction génératrice des moments de X; est 
HR HAN AU X Of 
Dx,(t) = ; QE qe — = etage qu. 
0 T(x) T(#) Jo 


On applique le changement de variable y = —(t — À)x pour obtenir 


À 1 Sr nt 
0 one f, = (5): 
——— ——” 
=T(k) 


La fonction génératrice des moments de S devient 


Ho. 


et on voit que S suit donc une loi Gamma de paramètres (À, nK). 


2.47 


1. Le risque o, du portefeuille s’écrit 


9; —= aŸo? + (1 — a1)?03 + 2a1(1 — a1)o102p12 


— (a? = 20102p12 + a>)a? — 2(a3 = 0102p12)@1 + 03. 


2. Ce risque est minimal lorsque 00? /Oa1 = 0 car le coefficient multiplicatif 
(o? — 20102p12 + 93) est positif. La dérivée partielle est 


do; 2 2 2 
2 = 2a1(01 — 20102p12 + 03) — 2(03 — 0102p12) = 0, 
1 


et enfin > 
O3 — 0102P12 


A = ——————--; . 
0? — 20102p12 + 03 
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sigma_p [%] 
12 14 16 
1 
5 
î 
[e) 


10 


mu_p [%] 


Fig. 4.5 — Courbes des portefeuilles possibles dans l’espace des 
risques et des rendements (exercice 4.17). 


3. Le rendement moyen du portefeuille 4, est une fonction de a1: 
Up = an +(l—-@)l2 &  &= sm 
1 — H2 


On substitue cette dernière équation dans l’expression de 0? pour avoir 


2 
= (a? — 20102p12 + 03) (He) epfer = D10202) + 02 
1 


Hi — H2 — H2 
__ of —20102P12+05 2  QH20T +103 — (a — H2)o102pr2 
es por — (0 
(u1 — 2) (u1 — 12) 
4 #20 + 05 — 2} H20102p12 
(ui — m2)? 


4. pi2 = 1 
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P12 — 0,5 


pi2 = —1 


5. Les courbes sont représentées dans la figure 4.5. 


Je 


Soient N une variable aléatoire qui compte le nombre de clients par jour et 
X; une autre qui mesure les dépenses en francs du i° client. On sait d’ores et déjà 
que E(N) = 50 et E(X;) = 8. Le chiffre d'affaire quotidien est S = Ra Xi. 
On ne peut en calculer directement l’espérance car la borne supérieure de som- 
mation est une variable aléatoire. Pour contourner ce problème, on calcule 
d’abord l'espérance conditionnelle de S | N = n et on en prend ensuite l’espé- 
rance par rapport à N 


Es(S) = En(Esn(SIN)) = En (son > x) 


i=1 


=  EN(NE(X1)) = E(N)E(X:) = 400, 


où l’on a utilisé l'indépendance entre X, et N. L’espérance du gain quotidien 
est de 400 €. 


1.19 


1. On veut trouver la distribution de la somme Z de 2 variables aléatoires 
binomiales indépendantes X et Y. Utilisons la fonction génératrice des 
moments 


Pz(E) = px(t)dy (Et) = (pet +1 — p)"(pet +1 — p}" = (pet +1—p)T, 


ce qui implique que Z suit une loi binomiale de paramètres (m + n,p). 
2. La probabilité d'observer X = x | Z = z s'écrit 


P(X =x,7Z = 2) 


P(X=x|Z=2)- PE =) 
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Comme Z et X ne sont pas indépendants, on utilise le fait que Z = X+Y 
et on obtient 


P(X — 
P(X =%|7Z = 2) = - 


d’où X | Z suit une loi hypergéométrique. 
3. L’espérance de X | Z = z est 


nz 


E(X|Z=2)= 


m+n 


et, par conséquent 
n 


E(X | Z) = 


m+n 


1.20 
La fonction de répartition de Z est 
Fz(2) = P(X+Y <z)=P(X <z-—Y) 
.. ( (un xt) fav = | : Fx (2 y) fr (dy, 


et sa dérivée 


fz(2) = h. Jx(z — y) fr (y)dy. 


Ici, la difficulté réside dans les bornes de l'intégrale car, X et Y suivant des 
lois uniformes (0,1), l’intégrant est simplement égal à dy. On sait que Z peut 
varier entre 0 et 2 car Z = X + Y. Comme 0 <z2—-y<1et0<y<l, 


LE 0dy + JS dy = 2 si 0<z<l1 
fz() = Li du + JF Ody = 2-2 si l<z<2 
0 sinon. 


1.21 


1. La distribution conditionnelle postulée signifie qu’il y a plus de volatilité 
en période d'incertitude. 
2. Calculons l’espérance de Y en utilisant les espérances conditionnelles 


E(Y) 


Il 


E(E(Y | X)) = 
= P(X=N)-EY|X=N)+P(X=E)-EY|X=-E) 
= 0,95: 0 + 0,05 -0 = 0. 
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Quant à la variance de Y 

var(Y) = E(Y?)-E?(Y)=E(Y?) 
= P(X=N) E(Y|IX=N)+P(X=E) E(Y|X=E) 
= 0,95: 1+ 0,05 : 5? — 2,2. 


3. L’espérance de Z est 


2 
E(2) = Eltos(m) = E(-T +01) 
o? o? 
= —— ET) =-— 
5 +oE(Y) : 
et sa variance 
2 
var(Z) = var(log(R)) = var (-S+0r) 


=, a var(Y) —=2,2x7, 
4. En utilisant la formule des probabilités totales, on peut écrire 
fr (y) = PIX = N): fyix=n(y) + P(X = E): fyix=r(y) 


et comme on se retrouve avec une somme de 2 lois normales, on en déduit 
que 
Y = NW(0, 2,2). 


5. Nous savons que 


et donc 


1.22 


Soit N; le nombre d’accidents durant l’année à pour un automobiliste et B 
un indicateur de la qualité de conduite. On sait que B suit une loi exponentielle 
avec espérance 0,1 et que N; | B = b suit une loi de Poisson de paramètre b. 
On suppose de plus que les N, | B = b sont indépendants. 


1. On cherche la probabilité qu’un automobiliste n’ait pas d’accident pen- 
dant les 3 premières années d’observation 


P(M =0,N: = 0, N3 =0) 


= | P(N =0,N2=0,N3=0|B =b)f8(b)db 
0 


_ P(N =0|B=b) f#(b)db. 
0 
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Lors de la dernière égalité, on a utilisé l'indépendance entre les N,; | B = b. 
On remplace maintenant les fonctions de distribution correspondantes 
pour obtenir 


P(N; =0,N2 =0,N3 = 0) | e-%.10e-1%4b 
0 
ce 1 Foret 
L | 108-1364 = — 10,-e au 
0 1 


2. Si K = k, cela signifie que l’automobiliste n’a pas eu d’accident pendant 
les k — 1 premières années et qu’il en a eu au moins un pendant la &°. 
Donc 


P(K=k) = P(Ny>1,Ny1=0,..., M =0) 


Il 


| P(N: > 1,Np1=0,..,N=0|B=b)f8(b)db 
0 


= | (ete A6 10e RE 
0 


_ de 10 us 2 e=A) 6 
0 


1 1 
= 10,6" (0+#)8 | —(10+k)b 
o EE 10+k° 


10 
(9 +k)(10 + k)° 


b=0 


3. On peut éviter le calcul de l'espérance conditionnelle de K | B = ben 
remarquant que X | B — b suit une loi géométrique avec probabilité 
p=1-e"t. On utilise alors simplement l'espérance d’une telle loi : 


sai 1 


E(K|B=b 2 | 
KIB=D= = 


1.29 


1. E(Y(a)) = E(aD + (1 — a)N) = 10a + (1 — a)3 =7a+3 et 


var(Y(a)) =  var(aD) + var((1 — a)N) +2a(1 — à) cov (D,N) 
202 + (1 — a)? + 2a(1 — a«)2: 0,8 
= 0,740? +0,26a + 1. 


Il 


2. La somme de variables aléatoires normales suit une loi normale. Done, 
grâce au point 1., Y(a) + N(7a +3, 3a? — 2a +1). 

3. On voit en 1° lieu que —-Y(a) + W(—7a — 3, 34? — 2a + 1), et ensuite 
Z = e-Y@) L log W(—7a — 3, 3a? — 2a + 1), par définition de la loi 
log-normale. 
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4. Par les propriétés des espérances conditionnelles 


Il 


E(X) E(E(X | Y)) = Ev(1- 5Z + 4Z +6Z +42) 
= 1+9E(Z) 
1 + 9exp(—7a — 3 + 3a°—2a+1) 


= 1+9exp(3a? — 8a— À). 


Il 


5. Par la formule des probabilités totales 


P(X=4) = ŸPX=4| pére 


+00 
=  J e-Yfv(y)dy = E(e*) = My(-1) 
— exp —7a — 3+ Sa2-2att) 
L, ces) 

p(5a dl 


où My (-) est la fonction génératrice des moments d’une variable aléatoire 
N(7a +3, 3a? — 2a +1). 


4.24 


Soit X; la variable aléatoire de Bernoulli qui vaut 1 si on trouve du pétrole 
dans la localité à et 0 sinon, avec 4 = 1,...,10. La variable aléatoire N = 
Rae X; suit alors une distribution binomiale de paramètres (10,0,2). On sait 
de plus que le profit dans la localité P;, si on y a trouvé du pétrole, suit une 
loi exponentielle d'espérance 5. 


1. On écrit le profit total Z comme 


Notons que la borne supérieure de la somme est une variable aléatoire et 
que Z | N = n suit une loi Gamma de paramètres (1/5,n) car c’est une 
somme de variables suivant une loi exponentielle. 


2. La variable aléatoire Z | N = 1 à une distribution exponentielle d’espé- 
rance 5, donc 


P(Z >10|N=1) = P(P > 10)=1-—Fp,(10)=e ? 0,13 


Comme mentionné dans le point 1., la variable aléatoire Z | N = 2 suit 
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une distribution Gamma de paramètres (5,2). Par conséquent 


2 
re>iin-n-r(Sn> 10) - 
i=1 


xæ=10 10 1 
+ 5 | exp (4) dx 
æ=0 0 5 


où l’on a utilisé le théorème d'intégration par parties. 


D RS 


E(Z|IN=n)=5n 


et 
E(Z) = En(Ez(Z | N)) = E(GN) =5E(N)=10. 


4. Par l’inégalité de Markov 


E(Z 
P(Z > 20) < 12) = 0,5. 
20 
La probabilité que le profit soit supérieur à 20 MioÆ n’est pas supérieure 
à 0,5. 
1.95 


1. Par le théorème central limite 


SIN) ex (D D). 


2. L’espérance de S'est 


et sa variance 
var(S) — Ef(var(S | N(t))) +var(E(S | N(t))) 
_ p(NO) à var (VO 
: ( p? )+ É ( T ) 


1 1 2Xt 
mn mn mn 
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3. Par définition des probabilités totales 


fs(s) = D fsna(s |n): P(N(E) = n). 


neN 
4. 
P(S> 60) = [7 fo = PANO = 0). [ fanetsmds 
: Ef-e (ti P(N(t) = n) 
5 A) _;, 
est -(S AE 


Chapitre 5 


Théorèmes limites 


Introduction 


Ce chapitre a trait à trois résultats importants de la théorie asymptotique 
des probabilités : la loi faible des grands nombres, la loi forte des grands nombres 
et le théorème central limite, dans sa version pour variables aléatoires indépen- 
dantes et identiquement distribuées (X; + F9 pour à = 1,...,n). Ce sont des 
résultats qui traitent les propriétés de la distribution de la moyenne d’une suite 
de variables aléatoires (X,). 

Les deux lois des grands nombres énoncent les conditions sous lesquelles la 
moyenne d’une suite de variables aléatoires converge vers leur espérance com- 
mune et expriment l’idée que lorsque le nombre d’observations augmente, la 
différence entre la valeur attendue (4 = E(X;)) et la valeur observée (X,) tend 
vers zéro. De son côté, le théorème central limite établit que la distribution 
standardisée d’une moyenne tends asymptotiquement vers une loi normale, et 
cela même si la distribution des variables sous-jacente est non normale. Ce ré- 
sultat est central en probabilités et statistique et peut être facilement illustré 
(cf. figure 5.1). Indépendamment de la distribution sous-jacente des observa- 
tions (ici une loi uniforme), lorsque n croît, la distribution de X,, tend vers une 
loi normale : on observe dans l'illustration la forme de plus en plus symétrique 
de la distribution ainsi que la concentration autour de l'espérance (ici u = 0,5) 
et la réduction de la variance. 

Les retombées pratiques de ces résultats sont importantes. En effet, la 
moyenne de variables aléatoires est une quantité qui intervient dans plusieurs 
procédures statistiques. Aussi, le résultat du théorème central limite permet 
l’approximation des probabilités liées à des sommes de variables aléatoires. 
De plus, lorsque l’on considère des modèles statistiques, le terme d’erreur re- 
présente la somme de beaucoup d'erreurs (erreurs de mesure, variables non 
considérées, etc.). En prenant comme justification le théorème central limite, 
ce terme d’erreur est souvent supposé se comporter comme un loi normale. 
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n=1 
0.0 0.2 0.4 0.6 0.8 1.0 


0 5 10 15 20 
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n=5 
0.0 0.2 0.4 0.6 0.8 1.0 


n=1 O n=50 
e 
e + 
[re] 
eg 8 
8 & 
e 
2 . | 
e __. ln e I [A 
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 


Fig. 5.1 — Illustration du théorème central limite: histogramme 
de la moyenne de 200 échantillons issus d’une loi uniforme sur 
l'intervalle (0,1) en fonction de la taille n de l'échantillon. 


Les trois théorèmes 


Loi faible des grands nombres 
Soient X1,...,X, une suite de variables aléatoires indépendantes et identique- 
ment distribuées. On suppose que E(|X;|) < æ et que touts les X; admettent 
la même espérance E(X;) = y. Pour tout e > 0 

lim P(|Xr-wl>e) =0, 

N— 00 
c’est-à-dire ve n converge en probabilité vers y, ce qui en économétrie est souvent 
noté plim X, = y. 


Loi forte des grands nombres 

Soient X1,...,X, une suite de variables aléatoires indépendantes et identique- 
ment distribuées. On suppose que E(|X;|) < æ et que touts les X; admettent 
la même espérance E(X;) = u. Alors, pour tout € > 0 


P (lim Fr=h}=i 


n— 00 


On dit que XÀ, converge presque sûrement vers y. 


5. Théorèmes limites 115 


Théorème central limite 
Soient X1,...,X, une suite de variables aléatoires indépendantes et identique- 
ment distribuées, d'espérance y et variance ao? finie. Alors 


Xp 


De + NON), (5.1) 


en distribution. 
On voit bien que, afin que la convergence se fasse, une standardisation est 
nécessaire: en effet, on peut voir le rapport dans (5.1) comme 


X; up. X;—E(X,) 


EVENT L \/var(X,) | 


Notes historiques 

La loi faible des grands nombres a été établie la première fois par J. Bernoulli 
pour le cas particulier d’une variable aléatoire binaire ne prenant que les va- 
leurs 0 ou 1. Le résultat a été publié en 1713. 

La loi forte des grands nombres est due au mathématicien E. Borel (1871- 
1956), d’où parfois son autre appellation: théorème de Borel. 

Le théorème central limite a été formulé pour la première fois par A. de 
Moivre en 1733 pour approximer le nombre de « piles » dans le jet d’une pièce 
de monnaie équilibrée. Ce travail a été un peu oublié jusqu’à ce que P.$S. Laplace 
ne l’étende à l’approximation d’une loi binomiale par la loi normale dans son 
ouvrage Théorie analytique des probabilités en 1812. C’est dans les premières 
années du XX° siècle que A. Lyapounov l’a redéfini en termes généraux et 
prouvé avec rigueur. 


Références (théorie) 


Ross, chapitre 8 [1]; Lejeune, chapitre 5.8 [3], et Morgenthaler, chapitre 5 [4]. 
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Exercices 
5.1 


Le nombre d'inscriptions à un cours d'économie politique est une variable 
aléatoire de Poisson de paramètre 100. Le professeur donnant ce cours a décidé 
que si le nombre d’inscriptions est au-delà de 120, il créera 2 sections et donnera 
donc 2 cours, tandis qu’en deçà une seule classe sera formée. 

Quelle est la probabilité que ce professeur ait à donner 2 fois ce cours ? 


5.2 


Supposons qu’on ait lancé 10 000 fois une pièce de monnaie bien équilibrée. 
1. Trouver un intervalle symétrique autour de 5 000 où l’on puisse dire que 
le nombre de pile y appartient avec une probabilité supérieure à 0,99. 

2. Comparer le résultat avec celui obtenu en appliquant l’inégalité de Che- 

bychev. 


9.3 


Soient X1,...,X 1 000 des variables aléatoires suivant la loi uniforme sur 
l'intervalle (0,1). Soit N le nombre d’entre elles inférieures à 0,003. Calculer 
P(N <5) en utilisant l’approximation par la loi de Poisson. Soit M le nombre 
d’entre elles comprises entre 1/4 et 3/4. Déterminer par approximation normale 
P(| M — 500 |> 20). 


5.4 


Christian vient d'ouvrir un salon de jeux. Pour l'instant, il n’a installé 
qu’une roulette et a simplifié le jeu de la manière suivante: on ne peut mi- 
ser que 1 euro sur 1 seul des 37 numéros (de 0 à 36) à la fois. En cas de gain, 
Christian donne 35 €. 

Si, après un mois, 5 000 personnes ont misé 1 €, quelle est la probabilité 
que Christian perde de l’argent ? 


9.9 


Quentin et ses 9 amis voudraient aller au cinéma. Ils décident de rassembler 
leur argent de poche et espèrent obtenir la somme totale nécessaire. 

On peut supposer que l’argent de poche de chacun est une variable aléa- 
toire X; qui suit la loi exponentielle de paramètre À = 0,06. Sa densité est 
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donc 


__f 0,06exp(—0,06x) x2>0 
FES { 0 sinon. 


De plus, on admet que les X; sont indépendants. 

1. Écrire la loi exponentielle £(À) comme une loi Gamma en donnant les 
paramètres de celle-ci. 

2. Soit Sio = 332, Xi. Quelle est la densité de S10? 

3. Sachant qu’un ticket de cinéma coûte 15 €, quelle est la probabilité que 
Quentin est ses amis puissent aller au cinéma ? 

4. Comment faut-il choisir z > 0 pour que la probabilité que la somme totale 
d'argent du groupe soit supérieur à z soit égale à 5 %7? 


9.6 


La moyenne des revenus annuels des employés d’une grande banque est égale 
à 50 000 €. 
1. Donner une borne supérieure pour le pourcentage p des revenus supérieurs 
ou égaux à 80 000 €. 
2. De plus, on sait que l’écart-type est égal à 10 000 €. Donner une borne 
supérieure plus petite pour p en utilisant cette information supplémen- 
taire. 


5.7 


Nous avons 100 composants que nous allons employer les uns après les 
autres. Cela veut dire que le composant 1 sera d’abord utilisé, puis lorsqu'il 
tombera en panne, il sera remplacé par le composant 2, qui sera lui-même rem- 
placé par le composant 3, et ainsi de suite. Si la durée de vie du composant à est 
distribuée selon une loi exponentielle avec espérance (en heures) 10 +4/10 pour 
i=1,...,100, et si les durées de vie sont indépendantes, estimer la probabilité 
que la durée de vie totale de l’ensemble des composants dépasse 1 200 heures. 


102 


__.. Ke. n{n+1) 2 _ n(n+1)(2n+1) 
Indication : DE = nr et Si = = D 


i=1 i=1 


9.8 


Samuel et Sonia jouent au jeu suivant. Chacun est appelé à lancer 100 fois 
un dé équilibré et à mesurer sa propre performance par le produit des scores 
obtenus à chaque lancer. 

Sonia commence à jouer et totalise le score CE x; = 4100, Soit Y; la variable 
aléatoire qui représente la valeur obtenue par Samuel au ° lancer. Donner une 
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approximation de la probabilité que Samuel obtienne un score plus élevé que 
Sonia, c’est-à-dire la probabilité 


100 
P (II > ww) 
i=1 


9.9 


Certaines particules subissent des collisions qui causent leur division en 
2 morceaux, chacun étant une fraction de la particule de départ. Supposons 
que la fraction X est distribuée uniformément sur l’intervalle (0,1). En suivant 
une seule particule après n divisions, on obtient une fraction de la particule 
de départ qu’on appelle Z, = X1 : X2 -...: X, où chaque X'; est distribué 
uniformément sur l'intervalle (0,1). On veut trouver la distribution de Z. 


1. Montrer que la variable aléatoire Y4 = —log(X}) a une distribution ex- 
ponentielle. 

2. Utiliser le résultat précédent pour trouver la distribution de S, = Y + 
Y +...+Y,. Ecrire la fonction de densité de S,. 

3. Exprimer Z, en fonction de $, et montrer que la fonction de densité 


de Z, est 
1 
à Æ  — | nl 
BE = (082) 
5.10 
On génère à l’ordinateur 100 000 nombres aléatoires u1,...,u100 000 Selon 


une loi uniforme (0,1) et on calcule leur moyenne géométrique 


1/100 000 
(u1 + U2 +... : Wi00 000)” ë 


Cette valeur sera très proche d’un certain nombre a. Calculer a et justifier votre 
réponse. 
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Corrigés 
Ou 


Soit X le nombre d'inscriptions à un cours d'économie politique. La variable 
aléatoire X suit une loi de Poisson d’espérance égale à 100. On cherche la 
probabilité qu’il y ait plus de 120 étudiants inscrits, soit 


100! 


il 


PIX EMO)=SE N 


i=121 


Plutôt que de s’exposer à de grosses erreurs numériques dues à la taille énorme 
du numérateur et du dénominateur, il est possible d'utiliser l’approximation 
normale (théorème central limite) pour calculer cette probabilité 


X — 100 . 120 — 100 
V100 V100 


Ainsi, la probabilité que le professeur doive donner son cours 2 fois est environ 
égale à 2,3 %. 


P(X > 120) + P ( ) = 1— (2) — 0,023. 


2.2 


Soit X le nombre de fois où la pièce donne pile. La variable aléatoire X a 
une distribution binomiale de paramètres (10 000, 0,5). Son espérance est égale 
à E(X) = np = 5 000 et sa variance à var(X) = np(1 — p) = 2 500. 

1. Pour calculer un intervalle autour de 5 000 avec les bonnes propriétés, on 

utilise l’approximation normale : 


P(-z A = 
1-a/2 50 1-a/2 | — 
= P(-502-472 +5 000 < X < 5021-42 + 5 000) = 0,99. 


On en déduit que l'intervalle [4 871 ,5 129] contiendra le nombre de piles 
avec 99 % de probabilité. 
2. Par l'inégalité de Chebychev, on a 


P(IX—E(X)1Z €) < 


ou plutôt dans le cas présent 


P(-e<X-E(X)<E) > 1- —— 
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On remplace alors € par a(x) - 21-42, avec o(x)? = var(X), pour obtenir 


PEL 000) ASE NS EU Eat) 


var(X) 
AE 
(021-a/2) 
1 
= 1 — 5 
71-02 


Ainsi, puisque la probabilité précédente est supérieure à 0,99, 21_,/2 vaut 
au maximum 10 et l'intervalle de confiance est inclus dans [4 500 ,5 500]. 


5.3 


1. Soit N le nombre de réalisations de X inférieures à 0,008. La variable 
aléatoire N suit une loi binomiale de paramètres (1 000 ,0,003) que l’on 
l’approxime par une loi de Poisson d’espérance À = np = 3. On calcule 
donc la probabilité 


4 Xe 
P(N<5)=S re © 0,82. 


k=0 


Il y a environ 82 % de chance que moins de 5 réalisations de la variable 
aléatoire X soient inférieures à 0,003. 

2. Soit M le nombre des mêmes réalisations, mais cette fois-ci comprises 
entre 0,25 et 0,75. La variable aléatoire M a une distribution binomiale 
(1 000 ,0,5), son espérance vaut 500 et sa variance 250. On trouve alors 


P(|M—500[> 20) = 1-— P(-20 < M — 500 < 20) 


1 P( 20 LL _— 
V250 V250 V250 


Il 


— -p(-<ze ee) 


Par le théorème central limite, on fait l’approximation que Z suit une loi 
normale centrée et réduite. Par conséquent 


4 
P(| M — 500 [> 20) =2-2P(Z<—2\|=0,1, 
( > 20) (2<7) 


ce qui signifie que la probabilité qu’il y ait plus de 20 réalisations de X 
comprises entre 0,25 et 0,75 est d’environ 21 %. 


5.4 
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Soit G; le gain de Christian sur le joueur 4. On cherche la probabilité que 


5 000 


la somme des gains $ = ÿ;_, X; sur 5 000 personnes soit inférieure à 0. 
Comme la taille de l'échantillon est importante, on utilise le théorème central 
limite pour approcher la distribution de $ ; il nous faut donc trouver l’espérance 
et la variance de G; 


E(G;) = P(Christian gagne) - 1 + P(Christian perd) : (—35) = 


36 1 1 
= —-—.35—— 0,027 
57. 57 M 
36 1 1 
var(G;) = E(G?) — E?(G;) = TA 35? — 35 © 4. 


On trouve donc 


P(#<0) = (52e _ —nE(G)) | 


V/nvar(G;)  V/nvar(G:i) 
VRE(Gi) 


[VE | L 1 &(0,33) = 0,37. 
var(G;) 


lè 


Il y a 37 % de chance que Christian perde de l’argent. 


9.0 


. La loi exponentielle E(À) est une loi Gamma de paramètres (X, 1). 
. Comme S:0 est la somme de 10 variables aléatoires qui suivent toutes la 


même loi exponentielle £(À) et sont indépendantes, S10 suit une Gamma 
de paramètres (X, 10). 


. Afin de pouvoir calculer la probabilité que Quentin et ses amis puissent 


aller au cinéma, on utilise l’approximation normale 


Sos 1500-55 
0,06 0,06 


La probabilité que Quentin et ses amis aiïllent au cinéma est d’environ 
63 %. 


. On cherche z qui satisfait P(S10 > z) = 0,05. Ainsi 


= 0e 
P(S10 > z) = P (2 _ LE) = 0,05, 
0,06 


0,06 


où Z © W(0,1). On en déduit finalement que 


0,06z — 10 1,64V10 + 10 
2 — 1,64 & D © 9258. 
VT0 20,95 ; Z 0,06 
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Il y à environ 5 % de chance que la somme du groupe soit supérieure 
à 253. 


9.0 


Soit X le revenu annuel d’un employé d’une grande banque et E(X) = 
50 000 son espérance. 

1. La seule information à disposition étant l’espérance de X, on utilise l’iné- 
galité de Markov pour trouver une borne supérieure pour le pourcentage p 
des revenus supérieurs ou égaux à 80 000 €: 

50 000 5 


= P(X < = —. 
p ( > 80 000) £ = 00 3 
Moins de 63 % des employés de la banque gagnent plus que 80 000 €. 


2. On connaît à présent l’écart-type de X et cela permet de calculer une 
borne supérieure pour p plus précise avec l’inégalité de Chebychev : 


p —= P(X > 80 000) = P(X — 50 000 > 30 000) — 


100002 1 
= LL —— — —, 
P(IX — 50 000 [> 30 000) < 2eo05 = 5 


Il y à au maximum 11 % des employés qui gagnent plus que 80 000 €. 
Dans le cas présent, la borne supérieure a été surestimée par l'inégalité 
de Markov. 


Del 


Soit D; la durée de vie du composant 4. La variable aléatoire D; suit une 
loi exponentielle d'espérance 10 + i/10 heures. On s’intéresse à la probabilité 
que S — ne D; soit supérieur à 1 200. L’échantillon étant grand, on applique 
le théorème central limite et il faut par conséquent calculer l’espérance et la 
variance de S 


100 100 100 ; 
= ) à | = ) ï) = ) 1 — 
d : b : ) i=1 ne i=1 a 5) 
1 100-101 
= 1 — —— = 1 505 
000 + = — | 


et 


100 100 : 2) 100 52 
FAR Co) > (uosai+ 7) 
100 : 101 1 100:101 201 


= 10 000 +2 5 100 G 


= 23 484. 


5. Théorèmes limites 123 


On utilise donc le théorème central limite pour trouver 
1 200 — 1 505 
V23 484 


La durée de vie de l’ensemble des composants à approximativement 98 % de 
chance d’être supérieure à 1 200 heures. 


P(S > 1 200) = P (z > ) = &(1,99) = 0,98 ; 


9.8 


Comme le dé est lancé un grand nombre de fois, on aimerait pouvoir utiliser 
le théorème central limite pour calculer une approximation de la performance 
des joueurs. On transforme donc le produit des lancers par un logarithme et on 


définit ainsi 
n 100 
Sy = log eu x) = ÿ log(Y;). 
i=1 i=1 
L’espérance et la variance de Sy s’écrivent 


100 6 
1 | 50 
E(Sy) = ù E(log(Y;)) = 100 ) g los) = 7 log(6!) = 110, 
i=1 j=1 


et 
100 


var(Sy:) D var(log(3)) = 100 (E((log(1))) = E*(log("))) 


SE: 50 : 
100 De be Ge E70) = 36,6. 


j=1 


On utilise maintenant le théorème central limite pour trouver la probabilité 
que Samuel obtienne le meilleur score 


100 
P (TL = uw) = P(Sÿ > 100log(4)) = P (2 > Lau Een) 
Fs var(Sy) 


lè 


1_% 100 log(4) — 110 
36,6 

où Z + NW(0,1). Il est donc approximativement certain que Samuel ne batte 

pas Sonia. 


) = 1— (4,79) = 0, 


2.9 


1. Soit Yx = —log(Xx). Sa fonction de répartition est 


Fu) = PO < y) = P(- log Xe < y) = 
= P(Xr>e %) =1-Fx, (e-#) =1-—e"t. 


124 Maïîtriser l’aléatoire 


Elle correspond à celle d’une variable aléatoire suivant une loi exponen- 
tielle d'espérance égale à 1. 

2. La variable aléatoire $, étant la somme de n variables aléatoires expo- 
nentielles de paramètre 1, elle suit une loi Gamma de paramètres (1,n) 
dont la fonction de densité est 


3. On trouve d’abord 
Zn = [Lx = exp (- Dex) = Xp 5 x) = exp(—S,). 
i=1 i=1 i=1 


On applique ensuite ce changement de variable sur la fonction de densité 
de Sh 


Pa, = Pau (ont) || = os 


2.10 


Soit n — 100 000. On cherche à calculer la moyenne géométrique o, de 
100 000 nombres aléatoires u; distribués selon une loi uniforme (0, 1). 


On = (u1-....un)/7 


Afin de trouver la valeur de o,, on en prend le logarithme 
1 nm 
108 On — >: log(u;). 


n = 
i=1 


Comme n est grand, on utilise la loi des grands nombres: 
li - ; log(u;) = E(log(w)) 
im — Ui) = u1)). 
no n 2 8 gui 


Ainsi 
1 ui =1 1 
Ellog(u)) = f° oglus)diu = toglun) al - fa 
0 üu1 =0 0 


et 
On: Se 


Chapitre 6 


Principes d’induction 
statistique et 
échantillonnage 


Introduction 


À partir de ce chapitre, on quitte le monde des probabilités pour rentrer 
dans le monde de la statistique, où les résultats de probabilités sont un outil 
indispensable. 

La démarche statistique consiste à utiliser l’information obtenue sur un 
échantillon pour pouvoir déduire de lPinformation sur la population (ou l’uni- 
vers) d'intérêt (cf. illustration à la figure 6.1): on extrait un échantillon de la 
population, on l’analyse et on infère sur la population. 

La démarche peut se décrire en trois étapes: 

1. choix d’un échantillon ; 

2. estimation de quantités ponctuelles (chapitre 7) ; 

3. estimation par intervalle et tests (chapitre 8). 

La méthode du choix de l’échantillon est cruciale. Les meilleures méthodes 
sont basées sur l’introduction contrôlée du hasard. Cela permet d’éliminer les 
jugements subjectifs et le biais de sélection. Le cas le plus simple est appelé 
échantillonnage aléatoire simple et consiste à tirer de façon équiprobable n in- 
dividus à partir de la population. Des schémas plus sophistiqués et efficaces 
qui contrôlent le biais peuvent être considérés, mais ne seront pas utilisés ici 
(échantillonnage stratifié, par grappe ..….). 

La qualité de l’information que l’on peut tirer d’un échantillon dépend de 
la variabilité sous-jacente des données et de la taille de l’échantillon, mais ne 
dépend quasiment pas de la taille de la population. La théorie de l’échantillon- 
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EXTRACTION 


on ECHANTILLON 


POPULATION 


INFERENCE 


Fig. 6.1 — Illustration de l’échantillonnage. 


nage permet de déterminer la taille de l’échantillon nécessaire pour atteindre 
un certain niveau de précision dans l'estimation qui en suivra. 

Une fois l’échantillon extrait de la population, on répond aux questions d’in- 
térêt (quelle est la médiane des revenus en Suisse, est-ce que cette valeur est 
égal à 60 000 francs, est-ce que le médicament A est plus efficace que le médi- 
cament B, etc.). La réponse statistique découle d’une approche probabiliste. 


Notes historiques 

L'utilisation de données partielles (l'échantillon) au lieu de l'information 
exhaustive (toute la population) a fait l’objet d’un grand débat au début du 
XX: siècle. C’est le congrès de l’Institut International de Statistique en 1925 
qui marque la reconnaissance officielle de la théorie des sondages. L'article de 
Neyman en 1934 est considéré comme un des textes fondateurs de la théorie 
des sondages. Ensuite la théorie des sondages se développe très rapidement 
graçe aux contributions de Deming, Stephan, Cochran en particulier dans la 
première moitié du XX° siècle. Les recherches se sont ensuite poursuivies en 
faisant appel à la statistique mathématique. 


Références (théorie) 


Dodge, chapitre 10 [5]; Ronchetti, Antille et Polla, chapitre 7 [6]; et Tillé, 
plus particulièrement chapitre 4 [7]. 
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Exercices 
6.1 


S'agit-il de variables aléatoires ? 

Moyenne de la population. 

Taille de la population. 

Taille de l’échantillon. 

Moyenne de l'échantillon. 

Variance de la moyenne de l’échantillon. 
Plus grande valeur de l'échantillon. 
Variance de la population. 


DOC OLIS CD Re 


Variance estimée de la moyenne de l'échantillon. 


6.2 


Afin d'estimer leur espérance respective, on échantillonne 2 populations. 
On utilise un échantillon de taille n1 pour la population I, qui présente un 
écart-type égal à o1. Pour la population II, dont l’écart-type vaut o2 = 201, on 
prend un échantillon de taille n2 = 2n1. Pour lequel des 2 échantillons est-ce 
que l’estimation de la moyenne de la population est la plus précise? 


6.3 


Le petit David a des problèmes de dyslexie. Des études montrent qu’un 
enfant atteint de dyslexie a une probabilité de 0,2 de ne pas obtenir 10 en 
comptant ses doigts. Pour vérifier empiriquement ce résultat, on décide de faire 
compter ses doigts à David. Quelle doit être la taille n de l'échantillon pour 
que l’écart-type de l’estimateur soit égal à 0,05? 


6.4 


Dans un certain canton suisse on veut estimer la proportion de familles vi- 
vant en dessous du seuil de pauvreté. Si cette proportion est environ 0,15, quelle 
est la taille de l’échantillon nécessaire pour que l’écart-type de l’estimateur soit 
égal à 0,02? 


6.5 


Dans un certain État américain on suppose que l'électorat est composé 
à 80 % de population urbaine et à 20 % de population rurale. Une proportion de 
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70 % des gens de la ville et seulement 25 % des gens de la campagne préfèrent le 
candidat D au candidat C. Dans un sondage effectué par l’éditeur d’un journal 
d’une petite ville, un électeur de la campagne a 6 fois plus de chance d’être 
choisi qu’un électeur de la ville. De ce fait, la proportion de l'échantillon en 
faveur de C sera un estimateur biaisé de la proportion de la population. 
1. Combien vaut ce biais? 
2. Est-ce que le biais est suffisamment grand pour que la moyenne de l’échan- 
tillon soit fausse (dans le sens où la moyenne de l'échantillon « élit » un 
candidat différent que celui que la population choisit)? 


6.6 


Un chercheur récolte un échantillon de 500 observations, mais perd les 
180 dernières mesures. Il n’a donc plus que 320 observations pour calculer la 
moyenne de l'échantillon. Quelle est l'efficacité de son estimation par rapport 
à celle qu’il aurait pu obtenir avec les 500 observations ? 
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Corrigés 
6.1 


Dans une population, les paramètres tels que sa taille (N), sa moyenne (y) 
ou sa variance (a?) sont connus et ne sont donc pas des variables aléatoires. 
De cette population, un nombre fixé (n) de variables aléatoires (X1,...,X,) 
est tiré et constitue un échantillon. Toute quantité dépendant de ces variables 
aléatoires est également une variable aléatoire. Les réponses de l’exercice sont 
alors : 


1. non (y); 


. oui (max(X;)): 
. non (o?): 


. oui (s2(X1,...,Xn)/n). 


D ND UE EX N 
=] 
© 
5 
niques 
à 
Le] 
DE 
ES 


6.2 


Afin de déterminer quel échantillon donnera une estimation de la moyenne 
la plus précise, on calcule la variance de chacune des moyenne. En général, on 
a 


2 
— © 
var(X) = —, 
n 
ce qui donne dans le cas présent 
2 
— © 
var(X1) = — 
ni 
et 
+ — o$  Ao? o? — 
var(X2) = 2 = 1 — = 2var(X1). 
n2 2n1 n1 


Par conséquent, l’estimation de la moyenne est plus précise dans le premier 
échantillon. Si l’écart-type est 2 fois plus grand, il faut quadrupler la taille de 
l'échantillon pour obtenir la même précision dans l’estimation de l’espérance. 


6.3 


On sait que dans la population des enfants atteints de dyslexie, 20 % n’ar- 
rivent pas à compter leurs doigts. On s'intéresse à un échantillon construit 
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sur la répétition de l'expérience avec David. Soient X1,...,X, des variables 
aléatoires qui valent 1 si David n'arrive pas à compter ses doigts et 0 dans le 
cas contraire. Les variables aléatoires X; suivent alors une distribution de Ber- 
noulli avec probabilité p = 0,2. La probabilité estimée qu’un enfant dyslexique 
n'arrive pas à compter ses doigts sera 


SX; = x, 
i=1 


ÿ = 


31 


On aimerait que l’écart-type de l’estimateur p soit égal à 0,05, ou, autrement 
dit, que sa variance soit égale à 0,052. Ainsi 


_ 1 1— 1 
var(p) = var(X) = var (: D x) = —var(X;) = DUb=P) = ee = 0,05?, 
n 


n mn 


et 


La taille de l’échantillon est donc de 64. 


6.4 


Soit X; la variable aléatoire qui vaut 1 si la famille à vit en dessous du seuil 
de pauvreté et O0 sinon. La proportion p de familles vivant en dessous du seuil 
de pauvreté dans l’échantillon est 


=] 


X; suivant une loi de Bernoulli de probabilité p, on a 


et 


On veut que l’écart-type de X soit égal à 0,02, donc 


= 12 
nue ë 6,02 & n=319. 
n 


Il faut 319 familles pour avoir un écart-type d'environ 0,02. 
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6.5 


Soit p la proportion de l’échantillon qui vote en faveur du candidat C et soit 
X; une variable aléatoire qui vaut 1 si l'électeur 4 vote pour C et 0 sinon. Soit V 
(respectivement C'A) l'événement « l'électeur vient de la ville (respectivement 
de la campagne) ». 

1. On connaît la vraie valeur de p. En effet 


P(X; = 1) = P(X; =1|V)P(V) + P(X; = 1| CA)P(CA) 
= 0,3-0,8+ 0,75: 0,2 = 0,39. 


p 


L’estimateur ÿ de p est p — 1 dr X;. Son espérance est 


ED = 2DEX)= EDP = 1) 
1 102 


= LD(PG=1 MP) +PX = 11 CH P CA) 


n° 


1 6 
= 0,3= +0,75 = 0,69 
1 7 + 1 7 1 2 
où Ÿ (respectivement CA) est l'événement « l'individu dans l'échantillon 
vient de la ville (respectivement de la campagne) ». On en déduit le biais 
de à 
biais(ÿ, p) = E(ÿ) — p = 0,69 — 0,39 = 0,3. 
2. Oui, le biais est suffisamment important pour que la moyenne de l’échan- 
tillon soit fausse. 


6.6 


Si ao? est la variance d’une observation X;, la variance de la moyenne d’un 
échantillon de taille n est alors 


2 
var(X) — _ 
n 


L'efficacité entre les 2 estimateurs est le rapport entre les variances, soit 


2 
0 Ce 
02/320 500 


Chapitre 7 


Estimation ponctuelle 


Introduction 


Dans ce chapitre on considère les différentes méthodes d’estimation ainsi 
que leurs propriétés. On est souvent amenés à estimer une ou plusieurs carac- 
téristiques de la population à partir des données (échantillon). Il peut s’agir de 
paramètre(s) de la distribution sous-jacente ou de caractéristique(s) de la popu- 
lation (espérance, variance, quantile, etc.), qui est (sont) bien entendu fonction 
des paramètres de la distribution. Par exemple, on peut vouloir estimer la mé- 
diane des revenus dans une région donnée, la proportion de la population qui 
vit en dessous du seuil de pauvreté, la proportion de votants qui donnera sa 
voix au candidat bleu, etc. 

Les estimateurs peuvent être comparés sur la base de différents critères: le 
biais, la variance, l'erreur carrée moyenne et la convergence. La biais mesure 
l'écart entre la vraie valeur (inconnue, dans la population) de la quantité à es- 
timer et la valeur que l’estimateur prend en espérance (c’est-à-dire en moyenne 
si l’on répétait l'expérience). La variance quantifie la variabilité autour de l’es- 
pérance. Idéalement, un bon estimateur possède un biais petit voire nul, et une 
petite variance. Il n’est pas possible de réduire simultanément le biais et la va- 
riance d’un estimateur, ce qui amène à la définition de l’erreur carrée moyenne 
qui exprime la combinaison de ces deux quantités. La minimisation de l’erreur 
carrée moyenne gère le compromis entre biais et variance. Ce compromis est 
une notion importante et apparaît dans beaucoup de situations en statistique. 
Finalement, un estimateur est dit convergent s’il converge en probabilité vers la 
vraie valeur lorsque la taille de l’échantillon augmente. Il est à noter que le biais, 
la variance et donc l’erreur carrée moyenne sont des mesures pour échantillons 
finis, alors que la convergence est une caractéristique asymptotique. 

La borne de Cramér-Rao constitue un résultat important dans la compa- 
raison d’estimateurs. Elle définit une borne inférieure à la variance de tout 
estimateur, en fonction de la distribution sous-jacente des observations. Si un 
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estimateur atteint la borne de Cramér-Rao (c’est-à-dire que sa variance est 
égale à la borne) on dit qu’il est efficace. 


Les méthodes considérées ici sont la méthode des moments, la méthode du 
maximum de vraisemblance ainsi que la méthode des moindres carrés, que l’on 
résume de façon non formelle ci-dessous. 

Méthode du maximum de vraisemblance. Comme son nom l’indique, cet- 
te méthode est basée sur la fonction de vraisemblance, qui est maximisée 
afin d'obtenir les estimateurs souhaités. Les estimations ainsi obtenues se- 
ront les valeurs les plus vraisemblable pour les paramètres étant donné les 
données que l’on a observées. Sous des conditions de régularité, les estima- 
teurs du maximum de vraisemblance sont convergents et leur distribution 
est asymptotiquement normale. Ils sont asymptotiquement efficaces. 

Méthode des moments. Cette méthode égalise les moments théoriques d’une 
population (E(X'), k = 1,2, ...), qui sont une fonction des paramètres, 
avec les moments empiriques de l'échantillon (1/n 32%, XF, k = 1,2, ...) 
afin d’obtenir des estimations des paramètres d’intérêt. Les estimateurs 
des moments sont convergents. Contrairement aux estimateurs du maxi- 
mum de vraisemblance, les estimateurs des moments ne sont en général 
pas efficaces. Sous certaines conditions de régularité, ces estimateurs sont 
asymptotiquement normales. 

Méthode des moindres carrés. Cette approche est fortement liée à l’ana- 

lyse de régression. Dans ce cadre, on minimise les erreurs au carré afin 
d'obtenir les estimateurs des paramètres. Le théorème de Gauss-Markov 
assure que si l’on suppose que les erreurs du modèle ont espérance 0 et 
sont indépendantes avec même variance finie, l’estimateur des moindres 
carrés est le meilleur estimateur linéaire non biaisé. Plus généralement, le 
meilleur estimateur linéaire non biaisé de toute combinaison linéaire est 
son estimateur des moindres carrés. 
Si l’on fait de plus l’hypothèse de distribution normale des erreurs dans 
le modèle de régression, alors les estimateurs des moindres carrés sont 
les estimateurs du maximum de vraisemblance et héritent donc de leur 
propriétés. 


Notes historiques 

La méthode du maximum de vraisemblance est due aux travaux de R. A. Fi- 
sher entre 1912 et 1922. 

La méthode des moments à en premier lieu était discutée par K. Pearson 
en 1894. Elle a été généralisée par L. Hansen (1982), méthode généralisée des 
moments ou GMM. 

La méthode des moindres carrés est née des intérêts de C. F. Gauss (1777- 
1855) en astronomie en 1795. Puisqu’il n’a jamais publié ses résultats, c’est sou- 
vent à A.-M. Legendre qu’est attribuée la paternité de la méthode des moindres 
carrés. Il l’a en effet publiée en 1806 dans son ouvrage Nouvelles méthodes pour 
la détermination des orbites des comètes. 
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La borne de Cramér-Rao port le nom du mathématicien suédois H. Cramér 
(1893-1985), et du statisticien indien C. R. Rao (né en 1920). En fait, l'inégalité 
a d’abord été énoncée par R. A. Fisher (qui était entre autre le directeur de thèse 
de Rao) en 1922. Ensuite, elle a été redérivée indépendamment par M. Fréchet 
(1943), G. Darmois (1945), H. Cramér (1946) et C. R. Rao (1945), raison pour 
laquelle on l’appelle aussi l’inégalité de Fréchet-Darmois-Cramér-Rao. 


Références (théorie) 


Casella et Berger, chapitre 7 [8]; Dodge, chapitre 10 [5]; Lejeune, cha- 
pitre 6 [3]; Morgenthaler, chapitres 6 et 7 [4]; et Rice chapitre 8 [9]. 
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Exercices 
Comparaisons d’estimateurs 


7.1 
1. Si E(X;) = u et Var(X;) = o?, montrer que 


T2 à 
2 2 
- D (Xi -X 

. 1 2 ) 


est un estimateur non biaisé de o?. _ 
Indication : développer 327, (Xi — X)°. 


2. Est-ce que s — Vs? est un estimateur non biaisé de oc? 


7.2 


On considère le modèle de régression simple 


YM=a+bri+te, i=1,...,1n 


où €1,...,6 sont n variables aléatoires (erreurs) indépendantes avec la même 


distribution et E(e;) = 0, Var(e;) = 0°. 
1. Calculer E(Y;) et Var(Y;). 


2. On désire estimer a et B par la méthode des moindres carrés. Donner les 


estimateurs àmc et Bmc. 


3. Montrer que mc et Pmo sont des estimateurs sans biais. 


4. Calculer Var(âmc) et Var(Bmc). 


7.3 


Pour estimer la moyenne y d’une population on utilise souvent la moyenne 
de l'échantillon X. Pour réduire la variance de X, on envisage d’utiliser un 


estimateur du type aX, 0 < a < 1. 


1. Calculer biais”(aX, u), var(aX) et l'erreur carré moyenne de aX. 


2. Faire un graphique de biais’(aX,u) et var(aX) en fonction de a, pour 


0 < a < 1. 


3. À quel prix (en biais) peut-on réduire la variance de l’estimateur de y? 


4. Pour quelle valeur de a a-t-on le meilleur compromis entre le biais au 


carré et la variance ? 
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7.4 


Soient X1,..., X\ distribués selon une loi (y, a?). On considère les 2 es- 
timateurs suivants de o? (u inconnu) 


pre : 
+= Xi-X) et 8=—Ù (X;-X). 
5 OS) Y et 5 n 2 ) 


Comparez-les du point de vue de l’erreur carrée moyenne. 


Indication : _ (Xi — X)? suit une loi x2_:. 


7.5 


Soient U1, ...,U, des variables aléatoires indépendantes qui sont distribuées 
uniformément sur l'intervalle (0, 4). Soit 
U+...+UÙ, 1 
pes RER OS) 2e RE .max{U1, ..., Un}. 
nm nm 


1. Trouver l’espérance et la variance de T.. 
2. Trouver l’espérance et la variance de S. 
Indication : trouver d’abord la distribution de Y = max{U1, ..., Un}. 
3. Comparer les 2 estimateurs du point de vue de l’erreur carrée moyenne. 


7.6 


Soit X1,...,X, un échantillon de variables indépendantes avec densité 


si —1<x<2 
sinon. 


fre) = {Er 


On dispose de 2 estimateurs de y = E(X;) 


NÉ EX 
Din) = et 

12 X1-X 
BR ee DR 


i=1 


Déterminer lequel des 2 estimateurs est le plus efficace. 


7.7 


1. Deux instituts de sondages effectuent un échantillonnage pour estimer la 
proportion x des Suisses qui sont favorables à la légalisation du canna- 
bis. Le premier échantillon montre une proportion P, = 60/200 = 30 % 
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de personnes favorables. Dans le 2° échantillon la proportion est P; — 
240/1000 — 24 %. Pour avoir une estimation globale, on prend simple- 
ment la moyenne P* = 27 %. Quelle est la variance (estimée) de cet 
estimateur ? 

2. Le 1° sondage est clairement moins fiable que le 2°. On propose alors de 
ne pas le considérer et d’utiliser l’estimateur P} = 24 %. Quelle est la 
variance (estimée) de cet estimateur ? 

3. Le meilleur estimateur est celui qui donne le même poids à chaque ob- 
servation (et non pas à chaque échantillon). Ceci veut dire qu’on prend 
l'estimation P = (60 + 240)/(200 + 1 000) = 25 %. Quelle est la variance 
(estimée) de cet estimateur ? 

4. Donner les efficacités des estimateurs considérés ci-dessus (par rapport 
au meilleur). 

5. Vrai ou faux ? 

Il est important de connaître la fiabilité des sources des observations. Par 
exemple, si on donne trop de poids à l’information provenant de sources 
non fiables, on peut perturber toute l’estimation. 


7.8 


La moyenne X d’un échantillon de taille n est utilisée pour estimer la 
moyenne y de la population. On désire déterminer n de sorte que l’erreur abso- 
lue | X — y | soit au plus égale à un nombre fixé d avec une grande probabilité 
1 — « (a donné). Soit un échantillon X1, ...,X, issu d’une loi Wu, 4). 

1. Existe-t-il pour tout & un tel n? 

2. Trouver n si «a = 0,05 et d = 1. 

3. Établir un graphe de n en fonction de 1—a (a < 0,1) en conservant d = 1. 


7.9 


Le rayon À d’un cercle est mesuré avec une erreur de mesure distribuée 
selon une loi W(0, a), o inconnu. 
Trouver un estimateur non biaisé pour la surface S du cercle étant donné que 
l’on dispose de n mesures indépendantes du rayon. 
Rappel: S = rR?. 


7.10 


Pour estimer la proportion p d’étudiant(e)s genevois(es) inscrits à la Fa- 
culté de Sciences Economiques et Sociales (SES) de l’université de Genève, on 
possède un échantillon X1,...,X, tel que X; = 1, si l'étudiant à est genevois 
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et X; — 0 sinon. 


1. Un estimateur naïf de p est p1 — 4 X;. L’estimateur p. est-il sans 
biais? Donner l’erreur carrée moyenne ECM(ÿ1, p1). 


D 1 
Re . L’estimateur 


2. Un estimateur alternatif de p est donné par p2 = 


D2 est-il sans biais? Calculer erreur carrée moyenne ECM(bo, p2). 
3. Comparer ECM{(p:,p1) et ECM(ÿo, p2) pour les valeurs suivantes de p: 
0, 1/8, 1/4 et 1/2. 


7.11 
Soient X1,...,X, n variables aléatoires indépendantes, telles que E(X;) — 
u et var(X;) = o? pour i = 1,...,n. 


1. Montrer que X est un estimateur sans biais pour y. 

2. Montrer que X? n’est pas un estimateur sans biais de p?. Déterminer son 
biais. 

3. Déterminer k tel que X? — ks? soit un estimateur sans biais de p?, où 
= Dis À). 


7.12 


Soient Y1, ..., YA indépendants et identiquement distribués selon la loi Ber- 
noulli(p), c’est-à-dire 


y: = { 1 avec probabilité p 


0 avec probabilité 1 — p. 
On désire estimer var(Y;) c’est-à-dire 4 = p(1 — p). Pour ce faire, on propose 
de s'inspirer de l’estimateur ÿ = Ÿ de pet de considérer 0 = Ÿ(1 — Ÿ). 

1. Calculer le biais de cet estimateur. 

2. Comment proposez-vous de corriger ce biais? 


Information de Fisher et borne de Cramér-Rao 


7.13 


On définit l’information de Fisher pour un paramètre 0 par 


J(0) = E (x log(fo(x)] ni) | 
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Montrer que si 0 appartient à un support compact 
0? 
10) = -E (route) 


Indication : E(& log(fo(x))) = & log(fo(x))]| fo(æ)dx = 0. 


7.14 


Soient Y1,...,Y, des variables aléatoires indépendantes distribuées selon la 
loi F9 dont la densité est fo et 0 appartient à un support compact. On notera 
J(0) l'information de Fisher 


2 


10) = E ([0e 00] = -E (geo) 


Définissons go(y1, ...,Yn) — fo(y1) : fo(ya) +... : fo(Un), la densité conjointe de 
ace sir Te 
1. Calculer l'information de Fisher J(6) par rapport à go(y1,...,Un)- 


2. Montrer que J(8) = nJ(0). 


7.15 


1. Calculer l'information de Fisher J(p) et déduire la borne de Cramér-Rao 
pour des estimateurs non biaisés lorsque X1, ..., X, sont tels que 


x. — 1 avec probabilité p 
*- | O0 avec probabilité q = 1 — p. 


Donner un estimateur de p qui atteint cette borne. 


2. Calculer J(o?) et la borne de Cramér-Rao lorsque X1,..., X, suivent 
une loi W(0, o?). 
Indication : utiliser la formule démontrée à l'exercice 7.13. 


7.16 


Calculer la borne de Cramér-Rao pour X1,...,X, provenant d’une loi de 
Pareto avec densité 


cbr A9) »>e 


fox) = { (0 sinon, 


avec 0 > let c>0. 
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7.17 


1. Calculer la borne de Cramér-Rao pour la variance d’un estimateur sans 
biais du paramètre À d’une loi de Poisson P(À). 


2. Pour estimer À, on utilise X. S’agit-il d’un « bon » estimateur ? 


7.18 


Dans le cas d’une loi normale de paramètres (4, o?), o? étant connu, X est 
utilisé pour estimer y. Atteint-il la borne de Cramér-Rao? 


Méthodes d’estimation 


7.19 


Soient X1,...,X, des variables aléatoires indépendantes avec densité 


(+87) —-1<x<1 
0 sinon. 


1. Calculer l’estimateur des moments Ôw de 6. 
2. Calculer le biais et la variance de Ô M. 


3. Pour étudier les propriétés statistiques de û) M, on effectue une simulation 
d’échantillonnage. On génère 1 000 échantillons de taille n = 10 suivant la 
loi fo(x), où 0 = 1, et on calcule pour chaque échantillon la valeur observée 
de l’estimateur M. Quel est en moyenne le nombre d'échantillons où la 
valeur observée de l’estimateur est supérieure à la valeur du paramètre 
0 —1? 


7.20 


Soit X1,...,X, un échantillon aléatoire provenant d’une distribution géo- 
métrique qui s'écrit 


PR =) == pp) ae 


1. Trouver l’estimateur du maximum de vraisemblance de p. 


2. Trouver l’estimateur des moments de p. 
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7.21 


Soit une variable aléatoire X distribuée selon la loi binomiale B(n, p). 

1. Calculer l’estimateur du maximum de vraisemblance pour p. 

2. Calculer la borne de Cramér-Rao. 

3. Montrer que l’estimateur du maximum de vraisemblance calculé en 1. 
atteint la borne de Cramér-Rao. 


7.22 


On suppose que X1,...,X, sont indépendants et identiquement distribués 
selon une loi Wu, o?). 
1. Pour y connu, donner l’estimateur du maximum de vraisemblance de o?. 
2. Dessiner le logarithme de la fonction de vraisemblance de 4 dans le cas où 
o? est connu. Donner l’estimateur du maximum de vraisemblance de y. 
3. Dans le dernier cas ci-dessus (a? connu), existe-t-il un autre estimateur 


de u qui possède une variance plus petite? 


7.23 


Soient X1,...,X, des variables aléatoires indépendantes suivant une loi avec 
fonction de densité 


fo(x) = (8+1)x°, pour 0 <x<1. 


1. Trouver l’estimateur des moments de 6. 
2. Calculer l’estimateur du maximum de vraisemblance de 6. 


7.24 


Si X1,...,X, sont issus d’une loi uniforme U{(a,b), calculer âm et bar, les 
estimateurs des moments de a et de b. 


7.25 


Considérons X1,..., X, indépendants provenant d’une loi uniforme {{(0, 4). 

1. Calculer Ÿ l’estimateur du maximum de vraisemblance de 06. 
Indication : dessiner la fonction de vraisemblance de 8 et en déduire le 
maximum. 

2. Déterminer la distribution de Y, c’est-à-dire calculer Fy(y) = P(Y < y). 
(Considérer d’abord le cas n = 2.) 

3. Calculer le biais de l’estimateur Ÿ et proposer un estimateur sans biais 
de la forme aŸ, avec a € R. 
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7.26 


Soient X1,...,X, provenant d’une loi de Pareto avec densité 
__ f argr (ta) > 0 
fa(x) = { 0 sinon, 


avec zo > O0 et «a > 1. 
1. Calculer l’estimateur des moments à de a. 
2. Donner l’estimateur du maximum de vraisemblance my de a. 
3. On décide de changer de paramétrisation en prenant a = 1/7. La densité 
s'écrit donc 
fa) = nu ir 
0 sinon, 
avec to > Det n<l. 
Calculer l’estimateur du maximum de vraisemblance my de 7. 
4. Quelle est la relation entre my et ÿmv ? Commenter. 


7.27 


On considère le modèle de régression 
Y = a+ br; +e; = dk: 


OÙ T1, ... , Zn SOnt fixés et €1, ..., € sont des variables aléatoires indépendantes 
suivant une loi W(0, o?). 


1. Démontrer que les estimateurs des moindres carrés pour a et B sont les 
estimateurs du maximum de vraisemblance. 

2. Donner la densité de Y;. 

3. Supposons par simplicité que a est connu. Calculer l’estimateur des moindres 
carrés de B et sa variance. 

4. Donner gg(y1,...,Yn), la densité conjointe de (Y1,...,Yh). 


5. Calculer l'information de Fisher J(6) par rapport à gs(y1,...,Un). 
6. Conclure en utilisant : 

- la borne de Cramér-Rao ; 

- l'exercice 7.14. 


7.28 


Soient X1,..., X, les revenus annuels des jeunes diplômé(e)s de l'Université 
de Genève durant leur 1° année de travail. On suppose que chaque X; suit la 
loi de Weiïibull de densité 
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avec c > 0 fixé. 
L’espérance d’une variable aléatoire X; qui suit la loi de Weibull vaut 4 = 
QT (1 + 1/c), où T'(a) est la fonction Gamma. 


1. Trouver l’estimateur du maximum de vraisemblance mv de 6. 

2. Calculer son espérance et sa variance. 
Indication: pour ce calcul, trouver d’abord la densité de Y; = X£ et 
ensuite E(X°) et var(X£). 

3. Calculer la borne de Cramér-Rao pour des estimateurs non biaisés de 0. 
Est-ce que ne est un bon estimateur ? 


7.29 


Soit X une variable aléatoire log-normale de paramètres y et et a?, c’est-à- 
dire vérifiant la propriété log(X) + W{(y, o?). La densité d’une telle distribution 
s'écrit 


2 
é [log(x) — y] | 
= —  —————————— 0 
f(x) = exp { 3o ,T> 
1. Calculez l’estimateur du maximum de vraisemblance {my de 1 basé sur 
X1,..., Xh, sachant que c ne dépend pas de y. 


2. Calculer E(jimv). S'agit-il d’un estimateur non biaisé ? 


3. Calculer Var(ümv) et la borne de Cramér-Rao. Est-ce que âmv est un 
bon estimateur ? Justifiez votre réponse. 


7.30 


Lorsqu'on désire estimer une distribution de revenus, on utilise souvent 
un modèle basé sur la loi log-normale, c’est-à-dire Y < log-normale(y, a?) ou 
log(Y) + N(u,0?). De plus, il arrive souvent qu’on exprime y par une com- 
binaison linéaire de variables explicatives. Prenons le cas simple d’une seule 
variable explicative, c’est-à-dire 4 = Gx. 

1. Étant donné un échantillon d'observations (x, Yi), calculer les estimateurs 

du maximum de vraisemblance (5mv, 621) de (5,a?). 

2. Calculer la borne de Cramér-Rao pour a? (B étant constant) et la com- 

parer à la variance de 67,4. Commenter. 


7.31 


On veut modéliser des parts budgétaires par une distribution Beta(a, 2) 
avec densité 


fat) =o(a+1l}r l(1-x), 0<r<1,a>0. 
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Soient X1,..., X, n observations indépendantes issues de cette distribution. 


1. Calculer l’estimateur 7, de a obtenu par la méthode des moments. 


2 
2. En sachant que V(T,) = Dee montrer que T, n’est pas efficace en 


calculant la borne de Cramér-Rao. 


7.32 


Une usine qui produit des pièces électroniques a décidé de marquer chaque 
pièce avec un numéro de série. Les numéros de série commencent à 1 et se 
terminent à V, où N est le nombre de pièces produites. Deux pièces sont tirées 
au hasard et leur numéros de série sont 888 et 751 respectivement. Quelle est 
l'estimation de N par la méthode des moments? Et quelle est l’estimation par 
la méthode du maximum de vraisemblance ? 


7.33 


Soient X1,...,X, des variables aléatoires indépendantes et identiquement 
distribuées dont la densité est définie par 


1. Déterminer l’estimateur des moments de 6. 
2. Déterminer 0wvy, l’estimateur du maximum de vraisemblance de 6. 


3. Utiliser ce résultat pour montrer que Ümvy est un estimateur sans biais 
pour 6. 


4. Pour n — 10, existe-t-il un autre estimateur non biaisé de 0 dont la 
variance est strictement plus petite que celle de 0wy ? 


7.34 


Lorsqu'une variable expliquée (endogène) est dichotomique, on utilise sou- 
vent un modèle logistique pour la modéliser. Soit 


1 
1+e-6x 


1 
P(Y =0IX 1 — ——— 
M=0IX= a) =1-p- 


PF =1|X=x)=p 
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où æ est une variable explicative. 
On dispose de n observations (y;,x;), à = 1,...,n. 
1. Montrer que la log-vraisemblance s'écrit 


U(B | yr, ces Un; L1; ..;Tn) = 


nm 


1 1 
” Due) +) 


i=1 


2. Écrire l’équation de vraisemblance. 

3. Comparer l'équation du point 2. avec l’équation normale pour l'estimation 
des moindres carrés de f de la régression linéaire classique y; = Bx; +€;. 
Que remarquez-vous ? 
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Corrigés 
4 


1. Pour montrer que s? est un estimateur non biaisé de o?, il faut vérifier 
que son espérance est égale à a? 


His }= 
= — -E be x) L EE DE HS x 4x) 
= (ru nr) 
PL - - (Sem + E?(X;)) — n(var(X) + Em) 
= —— (uiot +) ne +) = (nr — 1e? = 0? 


L’estimateur s? est sans biais pour o?. 


2. Par contre, on montre à l’aide de l’inégalité de Jensen que S n’est pas un 
estimateur sans biais de o 


E(s) = E(Vs?) 4 VE(s2) = 0. 


T8 


1. Le calcul de l’espérance et de la variance de Y; donne 
E(Y;) = E(a + Br; +e) = a+ Br; + E(é) = a + Br; 


et 


var(Ÿ;) = var(a + Bi + e;) = var(e;) = 0°. 


2. On aimerait estimer a et 5 par la méthode des moindres carrés. Pour 
cela, il faut minimiser la quantité 57%, (y; — à — Bx;)? par rapport à a 
et 6. On obtient l’ensemble d'équations 


{ 25; (gi — âme — Puoxi) -(—1) =0 
251 (vi — âme — Bmoti) : (—-xi) = 0. 
De la 1°, on déduit que 


nm nm 
& S_yi-nâmc — fuo dx = 0 
i=1 i=1 


& mc =7Y—/PmMcT, 
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et en utilisant ce résultat dans la 2° 


nm nm nm 
A À 2 
LE ) yiti — mo D 2 — Puo D x; = 0 
i=1 i=1 i=1 


& Sir — (7- BucT) Re — Puc Da: = 
= Ÿ i=1 i=1 
ss Di Yi(ti — 7) . Dis Wimi — 7) _ 
D x? — nr? D. =) 


= Patte D)(: =?) 


3. Vérifions que les 2 estimateurs sont sans biais 


PNEU SE ( CRE ) 
= op DE) 
= SE = 7} (oc — T) +BY (x: na) 
—=0 
= Di (i — T)ti Fe Det) _ 
TPE Em en 
et 
Elâmc) = E(G- Buc®t) = E(9) - TE(Ümo) = = DE) — TÜ 


= LS a+Bx)-6r=a+fr-Br= a 
i=1 


4. Pour terminer, on calcule la variance de chacun des 2 estimateurs 


_. 


GE me Fe re 


ar(yi) (EL (i = a rte = 7)’ 


var(Bmo) = var ( 
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où l’on a utilisé l’indépendance des y;. Pour âmc 
var(âmco) = var(g — BucT) = var(7) + 7 var(Bmo) + 2Tcov(7, Puc). 
La covariance entre 7 et ê mc se calcule de la manière suivante 


2 1€ "(ai — Ti 
HMPME 007 D mn 


| 

Ts à 
us 

MTS 

à 

es 


i- ZT 


nDa mi tt) 
o? Le 
—] LT; —T = 0, 
PONT E >} i—®) 
es, 
=0 


où, par l'indépendance des y;, cov(y;,y:) = 0 si à £ j et cov(yi, y) = o?. 
On trouve alors la variance de mc 


2 2 —2 
Re en ee Sn 
n DE à à RENE An 
gDinmi nr tn _o int 


© 
n 


PDA CEE ets m7 
7.3 


1. Pour calculer biais”(aX, y), on a besoin de E(aX) 


_ 127 
BOX = ElEN x lens 
nes (Rx) =0 


ce qui implique 
biais” (aX, y) = (au — y)? = (a — 1)? 


La variance et l’erreur carrée moyenne sont alors 


et 
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biais\2 


sigma 2/n 


[e] 


Fig. 7.1 — Graphe de biais’(aX,u) et var(aX) en fonction de a 
(exercice 7.3). 


2. La figure 7.1 montre le graphique de biais?(aX, y) et var(aX) en fonction 
de a. 


3. Pour diminuer la variance, il faut réduire la valeur de a. Cela implique 
une augmentation du biais en valeur absolue. 


4. Il existe 2 manières différentes pour choisir a: 


(a) a tel que biais” (aX, y) = var(aX) 


a. 
& (a—1}p? = a — 
n 
2 œ 
2 + y 
& a=—"* 
2 © 
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(b) a tel que ECM(aX,, 1) est minimal 


Ô —_ 
& 54 ECM(aX , u) = 0 


o? 
& 2a— +2(a—1)}u? =0 
nm 


12 


s o?/n +? 


Les 2 méthodes donnent des résultats différents. 


Ce 


7.4 


Soit Z une variable aléatoire distribuée selon une loi x? à (n — 1) degrés de 
liberté. Son espérance est (n — 1) et sa variance 2(n — 1). Calculons l’espérance 
de l’estimateur 5? 


E(s) = E ( I >_ (x -x>) 
= TE EDS -x>) = -—E(2) = ©. 


var(s?) — var ee ] >_ (x — x) 


i=1 
4 n 4 4 
œ 1 — 20 
= ar[—S (X;-X) | = ar(Z) = 
"(> ( ÿ) CESSE Mn n—1 
i=1 
et, par conséquent, son erreur carrée moyenne est 
204 
ECM(s?, o°) — | 
(82,9?) = 


L’estimateur 3? s'écrit comme une fonction de s2 
, n—1 
82 = 5? 
n 


On en déduit son espérance, son biais, sa variance et son erreur carrée moyenne 


— 1 
E(&) = ——6?, 
n 
2 
biais(?, o°) — =. 
n 
5 2(n—1) 
2) — 4 
var(5*) 5 : 
: 2(n— 1) 1 9n — 1 
Dr 4 ds 4 
ECM(5 ,© J= ne © 2e — ne 
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Comparons les erreurs carrées moyennes 


2 2n — 1 3n — 1 
E 2 2 LE 2 2 = 4 Aie 4 
CM(s°,0°) CM(£*, 0°) it aa PE] D° 


Le dernier résultat est toujours positif car la taille de l'échantillon n est obliga- 
toirement plus grande que 1. Cela implique donc que &? est plus efficace que 5? 
du point de vue de l’erreur carrée moyenne, et ceci malgré son biais. 


7.0 


Les variables aléatoires U1, ...,U, suivent une loi uniforme de paramè- 
tres (0,0). Leur espérance est 0/2 et leur variance 02/12. 
1. 9 
E(T) = 2E(U) = 25 = 0 
— 480 @ 
T) =4 = —<— = —. 
var(T) = Avar(U) SD 
2. Déterminons la fonction de répartition de Y = max(U, ...,U) 


Fy(y) = P(maxU; < y) = P(Ui < y)" = (Fu(y))" = GG) | 


Ainsi, la fonction de densité de Y est 


LOS 
AU RE 
Le calcul de l’espérance de Y donne 
0 n+1 |y=0 
Rue n y n 
E(Y) = —y"" dy = — = 
(Y) Lu y mntils Ati 


et implique 
1 
E(S) = — E(Y) = 0. 


L’estimateur S de 8 est sans biais. Nous cherchons à présent sa variance. 


0 n+2 |y=0 

E(Y?) = | TV" dy = . à Le 5 2 

La variance de Y est alors 
var(Ÿ) = E(Y?) — E°(Y) = 
: np n°? ge - n+1) = n7(r +2) L 
n +2 (n +1)? (n +2)(n +1)? 
et celle de S 
var(S) = + Drar(r) = TT 5 ce 
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3. Les 2 estimateurs sont sans biais. Le plus efficace est donc celui qui a la 
variance la plus petite. Comparons-les 


1 1 a 
var) = verts) = (ue) 


Ce dernier résultat est toujours positif, n étant forcément plus grand 
que 1. L’estimateur S'est donc le plus efficace du point de vue de l’erreur 
carrée moyenne. 


7.6 


L’estimateur le plus efficace est celui qui a l’erreur carrée moyenne la plus 
petite. Commençons par calculer l'espérance des 2 estimateurs pour en avoir le 
biais : 

ET) = SEX) + E(X)) = pi, 


et 


= 
Si 
Il 
31 
es) 
PTT 
hdi 
2 
DRE" 
| 
NI 
= 
x 
| 
al 
a 


I 
: 
x 
| 
[ 
T 
| 
— 
I 
3 
bu 
Ï 
pe 


Les 2 estimateurs sont des estimateurs sans biais de 4. Le plus efficace des 2 
sera, par conséquent, celui dont la variance est la plus petite. Le calcul des 
variances donne 


var(T1) = TUar(Xi) + var(X2)) = = 


où a? = var(X;). On a utilisé l'indépendance de X1 et X2 pour le calcul de 
cette variance. Dans le cas de var(72), on a 


1 1 1 
var(T2) = var (x a 51 + px) 


= - D var(X;) + TUar(Xi) + var(X2)) 


154 Maïîtriser l’aléatoire 


Dans le dernier calcul, il faut noter que les 2 covariances proviennent de la 
présence des variables aléatoires X, et X2 dans D X;. On en déduit que 


var(T>) — var(T) = —+—-——=— 5% 0. 
La variance de T2 est donc supérieure à celle de T1, ce qui implique que Ti est 


l’estimateur le plus efficace, malgré le fait qu’il n'utilise que l’information de 
X: et Xo. 


PT 
1. Soit l’estimateur P* tel que 
x 
= UE + Po). 
Sa variance estimée est 


sai) + var(P>)) = 


: 03-0,7 | 0,24-0,76 
ü 200 1 000 


_ 1 
var(P*) = 
1 —4 
1 ) = 3,08 - 107”. 


2. Le calcul de la variance estimée de P;, donne 


0,24 : 0,76 


var(P>) = = -1074. 
var(P) 000 1,82 - 10 
3. Celui de P donne 
0,25 - 0,75 
Far (P) = ———— = 0 
var(P) 1300 1,56 - 10 


4. Calculons l'efficacité de P* et P; par rapport à P 


1,56 : 104 
AÇPE PP) 1 
€ ( , ) 3,08 : 104 0,5 ; 
1,56 : 104 
#CP,P) . 
cff(P>, P) L82- 10 066 
5. C’est vrai. 
HD. 
Soit un échantillon X1, ..., X, tiré d’une loi normale de paramètres (u, 4). 


1. On cherche n tel que l'erreur absolue | X — y | soit au plus égale à un 
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40 


85 


30 


25 


20 


15 


10 


1-alpha/2 
Fig. 7.2 — Graphe de 1 — «/2 en fonction de n de l’exercice 7.8. 


nombre fixé d avec une probabilité 1 — @. Autrement dit 


Pr Sheet 


e P(DEH< SV) 210 
+ PÉOVME TES EVR) 210 
& LR = 20 & n= (res), 


Où 21_a/2 est le quantile de la loi normale. Il existe donc un n pour tout a. 
2. Si a —0,05 et d = 1, alors 21_ 4,2 — 1,96 et 


2.1,96\° 
n= ee) œ 15. 


3. La figure 7.2 contient le graphe de n en fonction de 1 — æ/2. 
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9 


Soient X1,...,X, des mesures du rayon dont la distribution est normale 
d'espérance À et de variance o?. On cherche un estimateur non biaisé de la 
surface S d’un cercle de rayon À. Commençons par calculer l'espérance de la 
nouvelle variable aléatoire T = x X? 


E(T) = E(rxX?) = n(var(X) + E°(X)) = 7 R°? + ro°. 


On voit que Test un estimateur biaisé de la surface du cercle. On corrige ce 
biais en utilisant l’estimateur non biaisé s? de la variance défini par 


1. 22 
2 2 
= ) X; — X 

. 1 2 ) 


pour obtenir le nouvel estimateur $ non biaisé de la surface du cercle tel que 


8 = r(X? — s°). 


7.10 


1. Soit l’estimateur 1 — Eds X;. Calculons son espérance 
. 1 
E(f1) = NE (X:) = p. 
L’estimateur p, est donc sans biais pour p. Sa variance est 


p(l — p) 


var(fi) = 
et son erreur carrée moyenne 


POP) 


ECM(ÿ:1, p1) = 


2. Soit le nouvel estimateur ÿ2 = ——. Le calcul de son espérance donne 


nE(b1) +1 _np+1 
n+2  n+2. 


E(p2) = 


Ainsi, son biais devient 


np + 1 __ 1—2p 
Hs PT 


biais(P2, p2) = 


De plus, sa variance est 


var(Da) = mme ei) n+2 
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ce qui implique la valeur de son erreur carrée moyenne : 


ECM(ÿo, p2) = Lite Er ne 


3. On compare maintenant ECM(ÿ:1, p1) et ECM(ÿo, p2) pour différentes va- 
leurs de p. Pour p = 0, ECM(p1, p1) = 0 et ECM(Do, p2) — T7 donc 
ECM(p1, p1) < ECM(p», p2). Pour les autres valeurs de p, il faut regarder 
le signe de ECM{(:, p1) — ECM(ÿ, p2) 


sign(ECM(f1, p1) — ECM(P2, p2)) = sign(p(1 — p)(8n + 4) — n). 
Ainsi 
— p=1/8: ECM(ÿ,p1) < ECM(ÿ2,p2), n >3, 


— p=l/4: ECM(ÿ,p1) > ECM(ÿo,p2), Vn, 
— p=1/2: ECM(ÿ,p1) > ECM(ÿ2,p2), Vn. 


441 
1. L’espérance de X vaut 
E(R) = E(X;) = y. 


L’estimateur X est donc sans biais pour y. 


2. On calcule l'espérance de Fa 


E(X?) = var(X) + E2(X) = — pe, 


et . : 
= © o 
biais(X ,p?) = — + pi? — y? = —. 
n n 
3. Soit s? = 5 ,(X; — X)?. On veut obtenir un nouvel estimateur 


de y? de la forme X° — ks?. Déterminons k 
52 2 5? 2 o? 2 2 2 2 {1 
E(X —ks*)=E(X )-kE(s) = —+p"-ko"=p"+o"|-—-k). 
n n 


Pour que cet estimateur soit sans biais, il faut que k — L. 
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Soit l’estimateur 0 = Y(1—Y). 
1. Pour calculer son biais, on calcule d’abord son espérance 


E(ÿ) = E(Y(1-Y))=E(T)- EF) = p—(var(Y)+E°(Y)) 


1 n—1 n—1 
= p— (ED +) = ——p(1l-p) = 0. 
nm nm nm 
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Son biais est donc 


Del se 
n 


biais(0, 0) — 


2. Pour corriger ce biais, on prendra l’estimateur 


ô. = TAF). 


n — 


7.13 


Partons de l'indication 


E (iottn)) = f [iesthote)] rotrrde = 0 


et dérivons-la par rapport à 0 (permuter l'intégration avec la dérivation est 
permis car x et 0 sont indépendants) 


de a toë ot) fear + | Srogto(n) a fotaar = 0. (A) 


On utilise alors 


pour obtenir 


farah =] (Son) ton 


Et finalement, grâce à (7.1) 


7.11 


1. Calculons l'information de Fisher pour la distribution ge(y1, ...,Yn). Le 
logarithme de cette distribution s'écrit 


log(go(u1, ..;Yn)) = log (Il it) = D_ log(fo(ui)), 


i=1 
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par conséquent 


2 


J(8) = -E ET) 
= _E (Satin) 
= DE (st) 


2. Les Y; ont la même distribution, donc 
2 


J(0) = -nE ( ° 


D ouf) ) = n (0) 


7.15 


1. La loi de probabilité d’une variable aléatoire X suivant une loi de Ber- 
noulli de probabilité p est 


P(X=2)=p#"{(1-p) +. 
On cherche la borne de Cramér-Rao pour p 


log(P(X = x)) = zlog(p) + (1 — æ) log(1 — p) 
Olog(P(X =x)) _x 1-x 


p pp 1-p 
dlog(P(X =x)) x 1—x 
op? EE 
L'information de Fisher est donc 
æ 1x 1 Lt) 1 
@) D? (=D)? p? a Hp) Ph 
et la borne de Cramér-Rao pour p 
1 
BCR = pp) 
n 


L’estimateur ÿ — X atteint la borne de Cramér-Rao. 


2. On procède de la même manière pour un estimateur non biaisé de la 
variance d’une loi normale de paramètre (0, 2) dont la fonction de densité 
est 


fo2 (x) Tr 


1 ins 
V2To2 + (7 ) | 
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On calcule l'information de Fisher afin de trouver la borne de Cramér-Rao 


1 1 1 
log( fo2 (x)) . — 3 log(2r) — 7 08(0°) = SET 
DETACIRENNEE 

d(o?) 202 204 
Plog(fo(r)) _ 1 1 » 
de 2 
Donc 
1 l £ 1 1 o? 1 
CES 1 | re) PRES = 2 
J(o*) - 56 en: TL 56 (X°) 251 + G6 ce 


et la borne de Cramér-Rao est 


BR = 2. 
7.10 


Pour obtenir la borne de Cramér-Rao d’un estimateur non biaisé du para- 
mètre 0 d’une loi de Pareto, on calcule en premier lieu l’information de Fisher 


log(fo(x)) = 0 log(c) + log(8) — (1 + 4) log(x) 


21e) = log(c) + à — log(x) 
®? fo(x 1 


et 


La borne de Cramér-Rao est par conséquent 


@? 
BCR = —. 
n 


TER 


La loi de probabilité d’une variable aléatoire X suivant une loi de Poisson 
de paramètre À est 

À? 
AE 


P(X =x)=e DT 
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1. On en calcule la borne de Cramér-Rao pour un estimateur sans biais. 


log(P(X = x)) = —À + xlog(À) — log(x!) 
Olog(P(X = x) æ 

EN he 
dlog(P(X =x)) x 
OO 


Ainsi, l'information de Fisher est 
©? log(f\(x)) x 1 
et la borne de Cramér-Rao 
BCR — È 
n 


2. Calculons la variance de X 
= 1 VE 1 x 
var(X) = var É »xi} = 20 = rvar(Xi) Fr. 


La variance de X atteint la borne de Cramér-Rao. Cela signifie que c’est 
un estimateur à variance minimale, donc un bon estimateur du point de 
vue de la variance. 


7.18 


Rappelons que la fonction de densité d’une loi normale de paramètres (14, o?) 


est 1 1 
Ju(x) = De exp(— (x = Be) 


On cherche la borne de Cramér-Rao pour u 


Log(fa(a)) = 5 log(2n) — logo — (x — 1)? 
Dlog(fur) 

> Ou (1) 
dto(fua)) _ _ 1 

sé De _ o?? 


ce qui donne l’information de Fisher 
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On en déduit la borne de Cramér-Rao pour u 


2 
BCE 
n 
La variance de X est 


n 


2e. lt. Î 
var(X) = 5 D var(Xi) = var(Xi) = —. 
i=1 


L’estimateur X atteint la borne de Cramér-Rao pour y. De plus, rappelons que 
X est un estimateur non biaisé de y. Il est donc le meilleur estimateur du point 
de vue de l'erreur carrée moyenne également. 
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1. L’espérance de la variable aléatoire X; est 


E(X;) = Fe 0 + 0x)dx = : Œ + o—) . = - 
L’estimateur des moments Or de 4 est donc 
Ôu = 3X. 
2. C’est un estimateur sans biais 
G] 


biais(dw, 0) = E(ôm) — 0 = 3E(X) — 0 = 3. 3-00. 


Pour trouver sa variance, il est nécessaire de calculer d’abord E(X?) 


1 3 A x=1l 
1 l/x x 1 
E(X2)= | -=x?(1 = -|[—+60— Sn . 
(X5) Î 3 + 0x)dx (+ ) 3° 
1 02 3-02 
= var(X;) = E(X?) — E(X;) = = - — = 
var(Xi) = E(X?) — EX) = à © = 
La variance de l’estimateur Üx est alors 
: 9 3 — @? 
Ou) = — X;) = ; 
var(Ün) = var( ) : 


3. Par le théorème central limite, on sait que 


ZE) _ X-6/3 20 pro à 
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Pour trouver le nombre moyen d'échantillons pour lesquels Üm est supé- 
rieur à la valeur de 0, on cherche la probabilité que 0x soit plus grand 
que 1, en sachant que 0 = 1 


P(ôm > 1)= P(X > D _ 


= X —-0/3 1/3—-1/3 

/3—02 Jia: 

In In 
où Z est une variable aléatoire issue d’une loi normale de paramètres (0, 1). 
On en déduit qu’il y aura en moyenne 1 000: à — 500 échantillons qui 
donneront un estimateur de 8 supérieur à la vraie valeur du paramètre. 


Notons que, dans le cas présent, ce résultat ne dépend pas de la taille des 
échantillons. 


1 


7.20 


1. Cherchons l’estimateur du maximum de vraisemblance puyvy de p. La 
vraisemblance est 


L(p | Lis 542 ,Tn) — (1 — p}i=1 autre 


et la log-vraisemblance 


l(p|%1,...,%n) = log(1 — p) De -r) + nlog p. 


i=1 
En maximisant {(p | æ1,...,2,) par rapport à p, on obtient 
Ô nn) x n 
Ôp 1—p p 
et l’estimateur i 
mMv = =. 
F X 


On en tire l’estimateur des moments fm de p: 
1 


PM — a 


Les 2 estimateurs sont identiques. 
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1.81 


1. Comme il n’y a qu’une seule mesure, la vraisemblance est égale à la 
fonction de distribution de X 


n nt 
Lio = (rap 
La log-vraisemblance s’écrit 
l(p | x) = log (") + xlog p + (n — x)log(1 — p), 


et sa maximisation par rapport à p donne 


Ô T n—x 
—l(p|x) = -- = (. 
9 | x) = Le 
On en déduit 
, X 
PMV = —. 
n 
2. Dérivons une 2° fois L(p | x) par rapport à p 
©? x n— x 
en PRES 
Ôp° PI RE. 


L'information de Fisher est alors 


NS te ER OR OR 
J(p) = E( p? 2) p? (1-p}? p(l-p) 


et la borne de Cramér-Rao pour un estimateur non biaisé de p est 


1 — 
Born - PU?) 
nm 


3. La variance de pmv est 


n2 n 


var(mv) = var (£) = np(l = p) _ p( =D) 


L’estimateur atteint bien la borne de Cramér-Rao. 
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1. La fonction de distribution d’une variable aléatoire normale d’espérance u 
et de variance a? est 


ao = en (ten). 
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-200 -100 


I(mu) 


-300 


-400 


mu 
Fig. 7.3 — Graphe de la log-vraisemblance de y de l’exercice 7.22. 
La vraisemblance d’un échantillon de ces variables aléatoires est 


1 nm 
L(o? | æ, +520) = (27) %/?(0?) exp | = D (xp)? |, 
20? 
et la log-vraisemblance 


n n = 
élire 3 log(2r) — 5 1080" — 53 di — u}?, 
i=1 


Dérivons-la 


1 n 
Ho? [qu ..,œn) = 2 + (a — w)? 
d(0?) (o 2 ,Tn) 202 | 954 2 1)”, 


d’où l’on obtient l’estimateur du maximum de vraisemblance 67,4 de 0°? 


n 


; 1€ 
Ev = DCE 
i=1 
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2. On peut récrire la log-vraisemblance comme 
ft) 


n n 2 1 2 LA 2 
—3 loë(2r) — 5 logo 35 > (mi -7) — —(T- y) 


n 
= const — 3527 — u)*. 


Le graphique de cette fonction est présenté à la figure 7.3. La log-vraisemblance 
a un maximum en u = T ce que l’on vérifie par l’optimisation suivante 


Ô 


qui implique 
Mv =T. 
Pour savoir si l’estimateur du maximum de vraisemblance my de u est 


celui qui a la variance minimale, il faut calculer la borne de Cramér-Rao. 
Cherchons l’information de Fisher 


Tree) = © 
©? 1 
DA ape 8 (Ja (e)) un 
1 1 
La borne de Cramér-Rao pour un estimateur sans biais de y est par 
conséquent 
oc? 
BCR = —. 
n 
Or 


var(Âmv) = var(X) — — 


L’estimateur my atteint la borne; il n’existe donc pas d’estimateurs 
de y ayant une variance plus petite. 


7.23 


1. Pour trouver l’estimateur des moments 01 de 0, calculons l’espérance de 
la variable aléatoire X 


5 0+1 = 
E(X) = æ(0 + 1)a°dx = THE) EE = —. 
0 
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On en déduit l’estimateur des moments 


ui gp à Guen 
Ôns + 2 I=X 


2. La log-vraisemblance de l'échantillon est 


18 21, ...,2n) = nlog(0 +1) +60 logxi. 


i=1 


On la dérive par rapport à 4 et on cherche la racine pour obtenir l’esti- 
mateur du maximum de vraisemblance Ov de 0 


Ô n . 
— ln = log x; = 0. 
5e (0 1, ,Tn) ire ogx; = 0 


D'où ” 
Ouv = — 
>, 


ST Les = 
i=1 108 Ti 


7.24 


L’espérance et la variance d’une variable aléatoire X suivant une loi uni- 
forme de paramètres (a, b) sont 


a + b (b— a)? 


E(X) = 5 var(X) = D 


Le 2° moment de X est alors 


a? + ab + b? 


E(X?) = var(X) + E°(X) = à 


Les estimateurs des moments âm et b M de a et b sont les solutions du système 


{ âm+bm =X 
> = 
22. te À 52 
à +àmbm+by _ Le n 2 
er mie en 


La 1° équation donne 


ce qui conduit par substitution dans la 2° équation à 
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1:89 


1. La fonction de distribution d’une variable aléatoire suivant une loi uni- 
forme de paramètres (0,4) est 


_f 1/8 si0<x<0 
fe(x) = { 0 sinon. 


La vraisemblance d’un échantillon de taille n issu de cette loi s’écrit 


L(8 | 21, ...,%n) = | [ fo(xi) = 
i=1 


: 1/07 si max(x1,...,2n) < 0 et min(x1, ...,&n) > 0 
_ { 0 sinon. 

Cette fonction est représentée sur la figure 7.4. On voit qu’elle n’est pas 
dérivable en son maximum. Il est donc inutile de chercher à l’optimiser 
par une dérivation. La lecture du graphique indique clairement qu’elle 
atteint son maximum en Ÿ = max(X1,..., Xh). 


0.6 0.8 1.0 


L(theta) 


0.4 


0.2 


0.0 


theta 


Fig. 7.4 — Graphe de la vraisemblance de 4 de l'exercice 7.25. 
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2. Calculons la distribution de Y pour n = 2. 


Fy(y) =  P(Y <y) = P(max(XN1, X2) < y) 
=  P(Xi <y,X2 < y) 
ind 
= P(Xi < y): P(X2 < y) = [P(Xi < y). 
De manière générale 


Fy(y) = [P(X < y)l”. 


Par conséquent 


0 si y < 0 
Fy(y) = 4 (y/80)" si0<y<6 
1 si y > 0. 


3. Afin de trouver le biais de l’estimateur Ÿ, on calcule son espérance. Pour 
cela, notons d’abord que 


0 nytL si 0 < y < 0 


sinon. 
Ainsi ù 
0 n+1l |Y— 
n n y n 
E(Y) = —Y" dy = — = 0. 
( ) . gn y On +1 LE n+l 


L’estimateur ŸY est donc biaisé 


0 


n 


On propose alors le nouvel estimateur Ÿ sans biais suivant 


: 1 1 
Ve parer 
n nm 


7.20 


1. L’espérance d’une variable aléatoire X qui suit une distribution de Pareto 
est 
a 
z 
a—1 


L’estimateur des moments à; du paramètre & est par conséquent 


E(X) = ” 


4 
X —x0 


à M = 
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2. La fonction de densité conjointe de tout l’échantillon est 


e —(1+a) 
Éa(t1, -..,Tn) = d"x6 qu s) : 
i=1 


et la log-vraisemblance est 
L(a|x1,...,2n) = log(fa(ti, ...,Tn)) = 


= nloga+anlog xo — (1 + a) Ÿ_ logs. 
i=1 
L’estimateur du maximum de vraisemblance y de a est la solution du 


maximum de L 


OL(a|x1,...,%») 


0 = = +nlogzo — D log = 0. 


i=1 


Par conséquent 
n 
Di log x; — nlogto 


3. Avec la nouvelle paramétrisation, la fonction de densité conjointe est 


n —1+1/n 
(ti, Tn) = np rg/7 (II s) ; 


La log-vraisemblance devient 


GMV = 


L(n| 1, ...,2n) = -nlogn + log to — (1+- DES 
et l’estimateur du maximum de vraisemblance fwv de n devient la solu- 


tion de 


OL(n | %1,...,%n nn le 
PAU) LT Logo + D D log = 0 


on 4 i=1 
Ainsi e 
: D log x; — nlogxo 
A —— ; 
n 
4. On remarque que 
L 1 
AMV = —. 
TMV 


D'une manière générale, (6) y = h(Ümv) si h est monotone. 
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T.OT 


Comme les £; suivent une distribution normale de paramètres (0, o?), les Y; 
suivent eux aussi une distribution normale, mais de paramètres (a+/x;, 0°). La 
fonction de vraisemblance d’un échantillon de taille n d’observations y; s’écrit 
alors 


1 F 1 
ÿ a RS D 
(a,6 | T1; > Ln; V1 y ) ( —) Exp | 20? e (y [e2 Bx ) | 


et la log-vraisemblance 
1 2 
Hat riens Un) = —nlog( 270) — 5 (y: — a — Bi) ‘ 


Maximiser la log-vraisemblance par rapport à æ et 5 revient à minimiser 

nm 2 . . . A / " . 
Ditgi — à — Bi)”, ce qui est le principe même de la détermination des 
estimateurs des moindres carrés. 


7.28 


1. On cherche l’estimateur du maximum de vraisemblance Ômuv de 0. La 
fonction de vraisemblance d’un échantillon de n variables aléatoires dis- 
tribuées selon une loi de Weibull est 


L(0 | T1, ... ,Tn) — c0? IEC (- Di à) 
i=1 


et sa log-vraisemblance est 


= 1 
I(O | x1, ..., Zn) =nloge-nlogô+(c—1)) mi xt. 


i=1 i=1 


Dérivons cette dernière pour trouver l’estimateur 0wvy : 
P 


2. Cherchons la fonction de densité de Y = X°. 


Fy(y) = P(Y < y) = P(X° < y) = P(X < y4/°) = Fx(y1/°) 
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1 1 
= fe (9) = fx (ge) gl 2 exp (5). 


Y est distribuée selon une loi exponentielle de paramètre 1/9. On en 


déduit 
à 1 1 
E(0 =E|- XF | = —n0 — 
et 
* d< 1 02 
var(Omv) = var (: d _ LL ee 
3. Calculons l'information de Fisher 
@) Des 
=) me 
©? l, “2% 
> 3az 108 fo(x) Hg 
1 2X° 1 2 1 
> JO)=-El = -— )—- E(X° TE 
(6) CG Fr.) Rp 
La borne de Cramér-Rao pour un estimateur non biaisé de 0 est par 
conséquent 
02 
BCR = —. 
n 


L’estimateur 0» est donc à variance minimale. 


140 


1. La vraisemblance d’un échantillon de n variables aléatoires distribuées 
selon une loi log-normale d’espérance y et de variance o? s’écrit 


L(u|%1,...,%n) er [£ eo (- or w})| 


i=1 


et la log-vraisemblance 


Ilan) =nlogc— D lost - 7 Dos - 1 


L’estimateur du maximum de vraisemblance my de y est alors la solu- 
tion de 


Donc 
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2. Calculons l’espérance de l’estimateur mv : 
102 


E(fiav) = © D Ellog X:) = pe 


i=1 


L’estimateur n’est pas biaisé. 


3. Sa variance est 
o? 


à 1 
var(imv) = 5 S_ var(log X;) . 


i=1 
On aimerait la comparer à la borne de Cramér-Rao pour un estimateur 


non biaisé de y. 


1 
log fu(æ) = logc—logx — (log x — 1)” 


Ô 1 
4 Sal Ju(x) = — 3 (log zi — Hi) 
L 1 
D ape 108 Jul ) = = 
1 
> Ju)= 
o? 
& BCR = —. 
nm 


L’estimateur fiv est un bon estimateur car sa variance atteint la borne 


de Cramér-Rao. 


7.30 


1. On veut trouver les estimateurs du maximum de vraisemblance Byv de 5 


et 62y de o?. À partir de la fonction de densité 
fu 1907) = exp (-prtlou(s) — wi) 
D?) = ———— exp | —-— = 
y on (3 (los) — 4 


on calcule la vraisemblance 


La leu Cr Ni ( 2 (leu) = An) 


et la log-vraisemblance 


log(L(8,o° | z,y)) = 
= 3 og(u) — 3 log(2r) — 2 log(o?) — x Dog) — Pi). 


u 
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Les estimateurs du maximum de vraisemblance sont les solutions des 
conditions de 1° ordre. Par conséquent, l’estimateur de GB est 


ÔlogL x 
2 — > DA log(yi) — Bmvæi) - (—xi) = 0 


Ka se Vi = dur 34 = 0 
à D log(yi)Ti 


Puy = ES, 
Lie 
et celui de o? est 
0 log L n : : 
Oo? do ae 264y > og(yi) — Buy) = 0 


u 


LEA Ov = D log(yi) — Buvri)? 


2. Calculons l'information de Fisher pour o? 


Olog(f(u)) _ 1 1 ï 
do?) D La 352 (108 y — bi) 
dlog(f(y)) _ 1 a : 
Do} — Æ a (os y HU) = 3x — se losy — E(log y) 
ser LR ER 
+ J(o*)=- oi ae À Elogy- E(log y))* = 351 + Ts 


Nous avons déjà vu que l’espérance de l’estimateur CE PR est 


Ainsi, si on pose g(6%) = #=16%,4, on trouve la borne de Cramér-Rao 
correspondante, à savoir 


_ (9 (Gv)) _ 2(n —-1)0* 
BCR = AIG Fos 


La variance de 6744, est 
F 1 _ 
var(ôfv) — var | — D (log(y) — Buvaæi) 
Mes 


= var (: D_Gog(ui) L mn) T AD, 


t 


Lors de la dernière égalité, on utilise la variance de &? trouvée dans l’exer- 
cice 7.4. On en déduit que oe n’atteint pas la borne de Cramér-Rao. 
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T1 


1. L’espérance de la variable aléatoire X est 


1 
E(X) = | za(a +1)2%"1(1 — x)dx 
0 
a+ a+2 æ=1 a 
— 1 — — — 
SE = ss. a +2 
On en tire l’estimateur des moments à de « 
M == . 2X 
—— =X & y -= ——. 
ôm +2 MES PE: 


2. Calculons en 1° lieu l'information de Fisher. 


log fa(x) = log à + log(a + 1) — (a — 1) log x + log(1 — x) 


ô 1 1 
log fax) = = + —— +-—lo8x 


E da a a+l 
2 
D 108 far) = + ra y 
+ Jo) - SE 
Ainsi, la borne de Cramér-Rao pour un estimateur non biaisé de a est 
BOR = æ(a +1)? 


n(a? +(a+1)?) 

Comparons-la à la variance de l’estimateur à : 

a(a+2)}*  æ@(a+1} 

2(a+3) a2+(a+1)? 
a(3a? + 6a +4) 


a —— ) 
2(a +3)(2a? +2a +1) 


car tous les facteurs sont positifs. La borne de Cramér-Rao est bien infé- 
rieure à la variance de l’estimateur &m ; l’estimateur n’est pas efficace. 


var(à) — BCR = 


7.32 


Soit X,; une variable aléatoire correspondant au numéro de série d’une pièce 
électronique. La variable aléatoire X; est distribuée selon une loi uniforme dis- 
crète de paramètres (0, N). Cherchons l’estimateur des moments Ny de N 


1. IN(N+1) N+1 
OT 
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ET & Nu =2X — 1. 
Les valeurs mesurées donnent X — 819,5, donc Nu = 1 638. Passons à l’esti- 
mateur du maximum de vraisemblance. Il est important de noter que, dans cet 
exercice, la fonction de vraisemblance n’est pas une fonction continue car N 
est un nombre entier. En d’autres termes, la maximisation par dérivation n’est 
pas faisable car le support n’est pas compact : 


N2 si max(x;) < Net min(x;) > 0 
LAN lan) = Ÿ 0 S Fa 


On se rend malgré tout bien compte que cette fonction atteint sa valeur maxi- 
male lorsque max(x;) = N. Par conséquent, l’estimateur du maximum de vrai- 
semblance Nyv de N est 


Nuv = max(X;) = 888. 


7.33 


1. Le calcul de l’espérance de X donne 


Fa FT x? 
+ —0 exp (5) dx 
æ=0 0 Q 20 
_ V3 [x (5) dx 
o V2r0 Ê 20 


1 T0 
= Von ele. 
15 2 


L’estimateur des moments Or de 4 est donc 


rôm _— 
— = X 
\ 2 


—2 

à 2X 

& Ou = —. 
T 


2. La vraisemblance d’un échantillon de n variables aléatoires X; est 


1 {+ n_ x? 
L(O {a ...,2n) = 2 (TI) _ (-25 ) 
i=1 


et la log-vraisemblance correspondante 


nm 


: 1 
(O2, ...,2n) = -nlo80+ D logri - AE 
i=1 


i=1 
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Dérivons-la par rapport à 0 


On obtient alors l’estimateur du maximum de vraisemblance Ôuv de 0 
suivant 


L de : 
uv = 35 DL 


3. Nous savons que X?/2 suit une loi exponentielle de paramètre 1/0. Son 
espérance vaut donc 0 et celle de l’estimateur 


E(Ümv) = RE () = 4. 


2 


L’estimateur est sans biais 


4. La variance de l’estimateur vaut 


var( (Ô Mv) var (Æ 


Calculons l’information de Fisher et la borne de Cramér-Rao pour un 
estimateur non biaisé de 0 


log fo(x) = — log 0 + log x — 


_ 


03 
1 2 X? 1 2 1 
0-72 )--2tx 
2 
SES 


L’estimateur atteint donc la borne de Cramér-Rao. Il n’en existe pas 
d’autres avec une variance inférieure, et ceci quelle que soit la valeur 
de n. 
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7.34 


1. La fonction de vraisemblance s’écrit 
L(B | V1, cs; Yns A1, ... ,Tn) — [L2"c —p}#, 


Par conséquent, la log-vraisemblance est 


I(B | y1, ce.) Un, L1, En) 
= 168 LL] Vis dits es) 


nm 


= N_ (ylogp+(1-— y) log(1 — p)) 


i=1 
= 2 … te : 
E i=1 HE He te ME 1+e-6ti | 
2. Établissons l'équation de vraisemblance 
log L a as es = Ï 
A RS ne HS 7. Ds 2 
05 =. l1+e-Pmvai 
Notons que cette équation peut s’écrire sous la forme D}, rix; = 0, où 
1 
Tdi - ——-—— 
* l1+e-Puvai 


est un résidu. 
3. L’équation normale pour l’estimation des moindres carrés de 8 de la ré- 
gression linéaire classique est 


nm 


ÿ Titi — 0, 


i=1 


OÙ Tr; = Yi — BmV. 


Chapitre 8 


Inférence 


Introduction 


Ce chapitre est d’abord une extension du chapitre précédent dans le sens 
où il étend la notion d’estimation ponctuelle à la notion d'estimation par inter- 
valles. Ensuite, il aborde la théorie des tests. À partir de l’échantillon on veut 
répondre à la question sur un paramètre ou une caractéristique de la popu- 
lation: est-ce que les dépense mensuelles en cosmétiques dépendent du statut 
professionnel, est-ce que les garçons ont plus de chance d’être prématurés que 
les filles, etc. 

Formellement, on teste une hypothèse H5 que l’on appelle l'hypothèse nulle 
contre une hypothèse H1 (ou H:), l'hypothèse alternative. La statistique de 
test permet de rejeter ou pas l'hypothèse H6. 

Les statistiques considérées ici sont les tests basés sur la moyenne, le test # 
de Student, le test du x? (test d’adéquation et test d'indépendance), les tests 
sur les paramètres de régression et les tests dérivés de la théorie de Neyman- 
Pearson. Ces tests permettent de traiter plusieurs situations courantes. 

Les propriétés d’une statistique de test se quantifient avec la notion d’erreur 
de 1"° espèce (a, la probabilité de rejeter H5 alors qu’elle est vraie), l'erreur de 
2° espèce (1 — 3, la probabilité de ne pas rejeter Ho alors qu'elle est fausse) et 
la notion de puissance (86, qui est le complément à 1 de l’erreur de 2° espèce). 

Deux approches s’affrontent historiquement : l'approche par la p-valeur (Fi- 
sher) et l'approche par les valeurs critiques, qui définissent une région de re- 
jet (Neyman-Pearson). Dans les deux cas, il s’agit de comparer la valeur que 
prend la statistique sur l’échantillon à la distribution de la statistique si l’hypo- 
thèse nulle était vraie (cf. figure 8.1). Avec la p-valeur on calcule la probabilité 
sous Ho que l’on observe une valeur autant voire plus extrême que celle que 
l’on a observée sur l'échantillon. Si cette probabilité est faible, cela indique que 
nous sommes face à un événement peu probable sous H, et produit de l'évidence 
contre H5. Dans l’approche par la valeur critique, après avoir fixé d’avance le 
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(a) (b) 


0.20 
0.20 


0.15 
0.15 


p-valeur Valeurs critiques 


Distribution de la statistique 
0.10 


0.05 
Distribution de la statistique 
1 


0.05 


Valeur de la Zone de rejet 
Statistique 


Aire=alpha/2 


Zone de rejet 
Aire=alpha/2 


0.0 
0.0 


-6 —4 2 0 2 4 6 —6 —4 2 to 2 4 6 


Fig. 8.1 — Tests statistiques: approche par la p-valeur (a) et par 
les valeurs critiques (b). 


seuil & (généralement 1, 5, ou 10 %), on détermine les valeurs critiques (pour 
la statistique) à partir desquelles on rejettera H5. 

Il existe un lien entre l’estimation par intervalle et les tests statistiques, 
raison pour laquelle les deux sujets ont été regroupés ici. En effet, si la statis- 
tique de test est un pivot (c’est-à-dire que sa distribution ne dépend pas des 
paramètres) alors tester l'hypothèse nulle selon laquelle un certain paramètre 
est égal à une valeur donnée (avec alternative bilatérale) revient à regarder si 
cette valeur donnée appartient à l'intervalle de confiance. 


Notes historiques 

La théorie des tests a été formalisée par J. Neyman et E. Pearson à la fin des 
années 1920 et au début des années 1930. Il est à noter que le test du chi-carré 
d’adéquation avait été proposé préalablement par K. Pearson (vers 1900). 

Le test t a été développé par Student, pseudonyme de W. $. Gossett (1876- 
1937), alors qu'il travaillait dans une brasserie. Le test du y? d’adéquation et 
d'indépendance est dû à K. Pearson (1857-1936). Il a été désigné comme une 
des vingt découvertes majeures qui ont marqué le XX siècle (cf. 20 Discoveries 
That Changed Our Lives, Special Issue of Science 84 en 1984). 


Références (théorie) 


Dodge, chapitres 11 à 13 [5]; Lejeune, chapitres 7 et 9 [3]; Moore et McCabe, 
chapitres 6 à 8 [10]; Morgenthaler, chapitres 8 et 9 [4]; et Rice, chapitre 9 [9]. 
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Exercices 


Intervalles de confiance 


8.1 


Un fabricant de voitures fait un test d’efficacité d’un certain modèle. On 
mesure les litres de consommation d’essence pour 100 kilomètres 
14,60 11,21 15,56 11,37 13,68 11,06 26,58 
13,37 15,98 12,07 13,22 12,01 15,07. 
On connaît la variance de la population: elle vaut o? = 16. 
1. Calculer un intervalle de confiance à 95 % pour la moyenne. 
2. Quel niveau correspond à un intervalle de longueur 3 litres/100 km ? 


3. Combien d'observations additionnelles sont nécessaires pour avoir un in- 
tervalle à 99 % de longueur 2 litres/100 km? 


8.2 


On considère un portefeuille avec n actifs R1,...,R\ indépendants, où l’on 
suppose que R; = N'(15,0?). 
Soit R, le rendement du portefeuille: R, = 37%, a R; avec D, a; = 1. 
1. Donner la distribution de R,. 
2. Supposons maintenant que les o; soient connus. Calculer un intervalle de 
confiance à 95 % pour y = E(R»). 
3. Application 


a 1% i=9,...,16 


M nat mean, = Jr 6707 til; 1:58 
On a observé les réalisations n={ 9% i=9,....16 


Calculer l’intervalle de confiance à 95 % pour y. 


D Mdr e ide 
et oj = 


8.3 


Dans un test de fabrication de composants d’une chaîne hi-fi, la baisse de 
puissance de sortie des circuits électriques après 2 000 heures d’utilisation a été 
mesurée. Un essai sur 80 composants identiques a donné les résultats suivants : 
la baisse de puissance moyenne est de 12 watts. Par ailleurs il est connu que 
l’écart-type de la baisse de puissance pour ce type de circuit électrique est 
o = 2 watts. 

1. Calculer l’intervalle de confiance (approximatif) à 95 % de la baisse de 

puissance moyenne de la fabrication. 
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2. Recalculer l’intervalle pour un niveau de confiance plus élevé, notamment 
99 %. 


3. Vérifier que l'intervalle obtenu en 2. est plus large que celui obtenu en 1. 
Expliquer ce fait. 


8.4 


On voudrait estimer la vitesse moyenne y à laquelle est parcouru le contour- 
nement de Genève. Les variables aléatoires X1, ..., X, représentent les mesures 
effectuées sur un échantillon pris uniquement parmi les hommes. On suppose 
qu’elles proviennent d’une loi normale d’espérance inconnue 4 et de variance 
connue a?. En deuxième lieu on récolte un échantillon de mesures de même 
taille uniquement parmi les femmes Y1, ...,Y,. Ces mesures proviennent d’une 
loi normale d’espérance inconnue y et de variance connue 0%. Pour estimer y 
on considère l’estimateur à = &(X + Ÿ). Donner un intervalle de confiance à 
95 % pour y basé sur à. 


8.5 


Soient X1,...,X, n observations indépendantes provenant d’une loi avec 
densité 


__f Axexp(—Ax) x >0 
fx) = { 0 sinon. 


1. Sachant que u = E(X;) = 2/X, exprimer var(X;) en fonction de y. 


2. Donner un intervalle de confiance approximé, au degré 95 %, pour u basé 
Cr SR Ce 


8.6 


Un institut de recherche planifie un sondage pour estimer la proportion 
de Suisses favorables à la révision du système de sécurité sociale (AVS). Le 
financement de l’étude permet d’analyser un échantillon de 200 personnes au 
maximum. On aimerait obtenir un intervalle de confiance à 95 % avec une 
longueur maximale de 10 % pour la vraie proportion de personnes favorables à 
la proposition. 


1. Déterminer la faisabilité de l’étude sur la base du financement prévu. 


2. Quel degré de confiance peut être obtenu pour l'intervalle sur la base du 
financement ? 
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8.7 


On simule à l’ordinateur 1 000 échantillons de taille 100 à partir de la loi 
N(5,1). Pour chaque échantillon on calcule l'intervalle 


I=[Ÿ-0,1:Y +01], 


où Ÿ est la moyenne de l'échantillon. 
Approximativement combien d’intervalles contiendront la valeur 5? Justifiez 
votre réponse. 


8.8 


Soient Y1,...,Y\ des variables aléatoires indépendantes et identiquement 
distribuées suivant une loi normale d’espérance y et de variance 1. Soit 


[Ÿ —b1/Vn Ÿ +b2/Vn] 


un intervalle de confiance pour u, où b1 et b2 sont des constantes positives. 
1. Exprimer le degré de confiance de cet intervalle en fonction de b1 et b2. 
2. Sous la contrainte d’un degré de confiance fixé à 90 %, quelles sont les 
valeurs b; et b2 qui minimisent la longueur de l'intervalle ? 


8.9 


Soient X1,...,X, des variables aléatoires indépendantes provenant d’une 
distribution uniforme sur l'intervalle (k0 ,(k+1)0), où k est une constante fixée 
d’avance. La fonction de densité de chaque X; est 


1 . 
_f 5 sk6<zx<(k+1)9 
fo(æ) = { O0 sinon. 


Calculez O£ l’estimateur des moments pour 0. Est-il consistant ? 
Donner l'erreur carrée moyenne ECM(, 0). 


Quelle est la distribution approximative (n grand) de 0m ? 


RO ETS 


Construire un intervalle de confiance (approximatif) pour 0 au degré de 
confiance de 95 %. 
5. Que peut-on dire de la longueur de cet intervalle lorsque k augmente? 


8.10 
Soient X1,..., X, des observations indépendantes et identiquement distri- 
buées selon une distribution dont la densité est 
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1. Trouver l’estimateur des moments de 6. 
2. Construire un intervalle de confiance approximatif au seuil de confiance 
de 95 % pour @ basé sur la moyenne des observations. 
Indication : la distribution de X; est une loi Gamma (3, 0). 


8.11 


Un biochimiste étudie un type de moisissure qui attaque les cultures de blé. 
La toxine contenue dans cette moisissure est obtenue sous forme d’une solution 
organique. On mesure la quantité de substance par gramme de solution. Sur 
9 extraits on a obtenu les mesures suivantes exprimées en milligrammes 


12 0,8 0.6 1.1 1,2 0,9 1,5 0,9 1,0. 


On suppose que l’écart-type est égal à o = 0,3. 
1. Calculer la moyenne de cet échantillon. 
2. Déterminer un intervalle de confiance à 95 % pour l’espérance de la quan- 
tité de substance toxique par gramme de solution. 
3. Le biochimiste trouve que l'intervalle obtenu n’est pas satisfaisant car il 
est trop long. Que doit-il faire pour obtenir une estimation plus précise ? 


Concepts de base sur les tests 


8.12 


Les situations suivantes requièrent un test d’hypothèse pour l'espérance u 
d’une population. On suppose dans les 2 cas que les données proviennent d’une 
loi N{u,a?), avec a? connu. 

— Un certain type d'expérience sur les rats mesure le temps qu’un rat met 
pour sortir d’un labyrinthe. Pour un certain type de labyrinthe le temps 
moyen est de 18 secondes. Un chercheur soupçonne qu’un bruit très fort 
aura comme conséquence de faire diminuer cette durée. Il mesure le temps 
mis par 10 rats pour sortir du labyrinthe dans ces nouvelles conditions 
(on suppose que a? = 2,25). 


16,0 19,2 16,9 18,5 17,2 15,5 18,9 14,3 17,3 17,5 


— La surface moyenne de plusieurs appartements d’un nouveau complexe 
résidentiel est annoncée par le propriétaire comme étant de 100 mètres 
carrés. La gérance chargée de la vente de ces locaux pense que les ap- 
partements sont plus petits. Elle envoie son ingénieur pour mesurer la 
surface d’un échantillon de ces appartements (a? = 25). 


96 92 100 99 103 101 96 109 106 94 95 100 109 98 
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Pour chacun des deux cas ci-dessus : 
1. donner l'hypothèse nulle et proposer la procédure pour la vérifier ; 
2. calculer la p-valeur et conclure. 


8.13 


Pour déterminer si le contenu effectif de nicotine d’une certaine marque 
de cigarettes est plus élevé que ce qui est annoncé sur le paquet (1,4 mg), 
on procède à un test sur un échantillon de taille n = 25 cigarettes. Pour cet 
échantillon, on obtient x = 1,79. On suppose que la variance d’une mesure vaut 
o? = 1. 

1. Formuler l'hypothèse nulle et l’hypothèse alternative dans le cas de cette 

étude. 

2. Définir et calculer la p-valeur. 

Est-ce que le résultat est significatif au niveau de 5 %? 
4. Est-ce que le résultat est significatif au niveau de 1 %? 


Se 


8.14 


Pour vérifier si la naissance de prématurés est liée au sexe du bébé, le Service 
de Maternité de l'Hôpital d’une grande ville nous fournit les données concernant 
l’année 1995. Il y a eu 512 cas de prématurés, dont 284 garçons. 

Décrire une procédure pour répondre à la question: « Est-ce que les garçons 
ont plus de chance d’être prématurés que les filles? » 


8.15 


Sur un tronçon autoroutier on a observé en moyenne 8 accidents par année 
pendant les dernières années. Cette année il y a eu 5 accidents. En postulant 
une distribution de Poisson pour le nombre d’accidents par année, est-il possible 
de conclure au seuil de 5% que le taux d’accidents a diminué cette année? 


8.16 


Dans les années 1970, les athlètes féminines d'Allemagne de l'Est étaient 
réputées pour leur forte corpulence. Le comité d’éthique olympique de l’époque, 
mettant en doute cette étonnante « virilité », avait fait appel aux services du 
docteur Volker Fischbach. Celui-ci sélectionna 9 athlètes féminines présentant 
des caractéristiques quasiment identiques, puis effectua des analyses mesurant 
leur quantité de substances hormonales virilisantes (dites androgènes) par litre 
de sang. Les résultats sont les suivants 


3,22 3,07 3,17 2,91 3,40 3,58 3,23 3,11 3,62. 
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(On peut considérer que ces mesures sont indépendantes et proviennent de la 
loi normale.) On veut tester l’hypothèse : « les athlètes allemandes ne sont pas 
dopées. »En sachant que chez une femme la quantité moyenne d’androgènes est 
de u = 3,1, le docteur Fischbach a-t-il rejeté l’hypothèse ? 


8.17 


Soient 20 variables aléatoires X1,..., X20 indépendantes et identiquement 
distribuées selon une loi W(u,a?). On veut tester l’hypothèse Ho : a? = o$ et 
pour cela on utilise 


Le : 
A2 2 
= X; — X)°. 
“ n—1 x ) 
1. Quelle est la distribution de £ 57%, (X; — X)? sous Ho? 
2. Calculer la valeur critique k, pour un test unilatéral (Hi : a? > oë) au 
seuil de 5 %. 


8.18 


Douze paires d’agneaux jumeaux sont sélectionnés pour comparer 2 régimes 
Let IT ; dans chaque paire les agneaux ont été nourris avec des régimes différents. 
Les poids des agneaux après 8 mois sont les suivants 


CDOISSSSESESEIRESSESERBEUEUEEX 


I 86 | 96 | 82 | 103 | 91 | 88 | 94 | 90 | 97 | 87 | 97 | 105 
I 106 | 118 | 106 | 91 | 96 | 102 | 100 | 100 | 108 | 105 | 118 | 93 
En admettant qu’à la base les 12 paires sont semblables et en considérant 


un modèle normal, tester Ho: « les régimes I et II sont équivalents » contre H: 
« le régime I est différent du régime IL » 


8.19 


Les teneurs en azote de 30 échantillons d’un même terrain ont été mesurées 
par 2 méthodes d’analyse différentes : 15 échantillons par la méthode A et 15 
autres par la méthode B. Sur la base des résultats suivants et en considérant un 
modèle normal, peut-on admettre, au seuil de 5 %, que les 2 méthodes donnent 
en moyenne des résultats analogues ? 

— méthode A 

3,51 3,01 3,33 3,31 3,54 3,17 3,50 2,72 3,24 3,48 1,97 2,85 2,51 2,93 1,83 

— méthode B 

2,34 3,12 3,30 2,15 3,13 2,84 2,97 3,65 3,89 3,23 2,46 2,70 2,44 2,41 2,85 
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8.20 


Une entreprise pharmaceutique désire tester l'effet de 2 somnifères (Sopo et 
Dodo). Le médecin chargé de étude vous apporte les mesures (nombre d’heures 
de sommeil additionnel par rapport à la moyenne habituelle) effectuées sur 
20 individus. 


PELLE ISI7/S/5/0 


On veut tester l'égalité des effets des 2 somnifères. Nous supposons en plus que 
les données suivent une distribution normale. 
1. Définissez le test que vous pouvez faire dans ce cas, en posant les condi- 
tions nécessaires, ainsi que l'hypothèse nulle et l’hypothèse alternative. 
2. Effectuez le test pour un seuil de & = 5 %. Concluez. 


3. En présentant les résultats de l’étude au médecin qui vous a chargé de la 
mener, vous réalisez que vous avez mal compris et qu’il s’agit en fait d’une 
expérience où chacun des 10 individus a testé chacun des 2 somnifères, ce 
qui donne le tableau suivant 


ETES NENSRNERAEMEREU 


Ainsi on veut tester de nouveau l'égalité de l’effet des 2 somnifères. 


(a) Définissez de nouveau les hypothèses nulle et alternative, et effectuez 
le test au seuil de à = 5 %. 
(b) Lequel des 2 tests effectués est correct? Justifiez. 


8.21 


Le nombre d’arrivées par heure au guichet d’une grande banque suit une loi 
de Poisson P(À). Pour améliorer le service à la clientèle, la banque nous confie 
la tâche de vérifier si on peut supposer que le nombre d’arrivés par heure est 
égale à 25, en sachant que pour n = 30 échantillons observés la semaine passée 
on à obtenu æ = 27. Que peut-on lui répondre? 


Propriétés des tests 


8.22 


Les bouteilles d’une boisson très populaire devraient contenir 300 mL. Comme 
la machine qui remplit ces bouteilles n’est pas très précise, il existe des dif- 
férences d’une bouteille à l’autre. On peut supposer que la distribution du 
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contenu d’une bouteille est normale avec écart-type égal à 3 mL. Un étudiant 
qui soupçonne que les bouteilles sont moins remplies qu’elles le doivent, mesure 
le contenu de 6 bouteilles et obtient les valeurs 


299,4 297,7 301,0 298,9 300,2 297,0. 
Est-ce qu’on peut affirmer que le contenu des bouteilles est inférieur à 300 mL ? 


Un calcul de puissance nous permet de déterminer à partir de quelle quan- 
tité de liquide manquant le test arrive à détecter le mauvais remplissage. Pour 
cela on suppose un niveau de test a = 5 %. 


1. Déterminer la puissance du test par rapport à l’alternative 1 = 299. 
2. Déterminer la puissance du test par rapport à l’alternative u = 295. 


3. Est-ce que la puissance par rapport à l’alternative 1 — 290 va être su- 
périeure ou inférieure à celle trouvée en 2.7? Expliquer les raisons de ce 
comportement. 


8.23 


Deux types de pièces de monnaie sont produites dans une fabrique: des 
pièces homogènes et des pièces mal équilibrées, lesquelles montrent la face pile 
dans 55 % des cas. Supposons que nous possédons une pièce dont nous ignorons 
la provenance. Pour pouvoir déterminer de quelle pièce il s’agit, nous effectuons 
le test suivant : la pièce est lancée 1 000 fois ; si l’on obtient pile 525 fois ou plus, 
alors on conclut que c’est une pièce mal équilibrée, tandis que si l’on obtient 
pile moins de 525 fois, alors on conclut que c’est une pièce homogène. 


1. Si la pièce est réellement homogène, quelle est la probabilité que l’on 
aboutisse à une conclusion fausse ? 


2. Si la pièce est réellement mal équilibrée, quelle est la probabilité que l’on 
aboutisse à une conclusion fausse ? 


8.24 


On fait passer un test d'aptitude à 500 étudiants genevois. Les résultats 
indépendants de ces 500 étudiants donnent une moyenne de T7 = 461. 


1. En supposant que l’écart-type de la population est connu et égal à 100, 
peut-on dire que l’espérance des résultats de tous les étudiants de Genève 
n’est pas supérieure à 450? 

2. Est-ce que le test utilisé au seuil de 5 % est suffisamment puissant pour 
détecter une augmentation de 10 points dans le résultat des étudiants? 
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8.25 


On désire tester si la durée de vie moyenne d’un tube électronique est égale 
à 1 600 heures ou si elle est plutôt inférieure à cette valeur. Les observations 
sur un échantillon de taille 16 suivent une loi normale avec X = 1 590 heures 
et 6 = s = 30 heures. 

1. Donner les hypothèses H6 et HA. 
Quelle statistique de test utilisez-vous ? 
Peut-on rejeter HQ à un seuil de 1 %? 


EN 


Calculer l’erreur de 2° espèce et la puissance du test au seuil de 1 % pour 
u = 1 570. 


8.26 


Soient X1,...,X, provenant d’une loi Gamma (9, «). Donner le test le plus 
puissant pour tester : 

1. Ho : 0 = 6 contre HA : 0 = 6; ; 

2. Ho : 0 = 05 contre H1 : 0 > 65. 


8.27 


La durée de vie des ampoules servant à l’illumination des auditoriums est 
modélisée par une loi exponentielle £(À) avec densité 


Pour optimiser le service d’entretien (coupures budgétaires obligent), on veut 
savoir si la durée de vie de ces ampoules est de 30 jours. La service d'entretien 
procède à des mesures sur un échantillon de taille n — 400 pour lequel il observe 
x — 27,6. Avec ces données peut-on infirmer que la durée est de 30 jours? 

Pour un seuil a = 5 % fixé, calculer la puissance du test pour les valeurs 
suivantes de l’alternative: durée de vie de 25, 28 et 35 jours. 


8.28 


Le point de fusion de 16 échantillons d’une marque d’huile végétale a été 
déterminé et on a obtenu T = 94,32. On suppose que la distribution de ce point 
de fusion suit une loi normale avec espérance y et écart-type o = 1,2. 


1. Tester H9 : 1 = 95 contre H, : u < 95 avec un seuil & = 0,01. 


2. Si la vraie valeur de y est 94, quelle est la valeur de la puissance pour le 
test défini en 1.? 
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3. Quelle est la valeur de n nécessaire pour assurer que l’erreur de 2° espèce 
soit égale à 0,01 pour un niveau a = 0,01? 


8.29 


Une banque désire vérifier l'hypothèse que l’omission des frais sur les cartes 
de crédits des clients qui ont un chiffre d’affaire annuel supérieur à 5 200 € 
amène à une augmentation du chiffre d'affaire annuel moyen. Cette offre d’omis- 
sion de frais est accordée à un échantillon aléatoire de 200 clients et le chiffre 
d'affaire obtenu dans l’année courante est comparé avec celui de l’année précé- 
dente. L'augmentation moyenne du chiffre d’affaire parmi les clients de l’échan- 
tillon est égale à 332 € avec une variance estimée de l’augmentation moyenne 
égale à 108? <€?. 

1. Peut-on dire, à un seuil de 1 %, que l’offre de la banque à généré une 

augmentation du chiffre d’affaire ? 

2. Donner un intervalle de confiance au degré 99 % pour l'espérance de 
l’augmentation annuelle 4 du chiffre d’affaire. 

3. Utiliser l’approximation normale pour déterminer la puissance du test 
effectué au point 1. par rapport à l’alternative que l'espérance de l’aug- 
mentation u est égale à 150 €. 

4. Quelle est la taille n de l’échantillon que la banque doit choisir pour que 
la puissance du test par rapport à l'alternative y = 150 soit égale à 80 %? 


8.30 


Vingt informaticiens ont installé chacun soit Linux, soit WinNT. Le temps 
nécessaire (en minutes) à chacun pour l'installation est répertorié dans le ta- 
bleau suivant. 


On suppose que les données proviennent de la loi normale. 


1. Calculer l'intervalle de confiance de la durée moyenne d'installation de 
chacun des 2 logiciels. 


8. Inférence 191 


2. Par un test statistique, déterminer au seuil de 5 % si la durée d'installation 
de Linux est supérieure à celle de WinNT. 


3. Supposons maintenant que les variances des temps d'installation sont 
connues : 0? = 225 pour Linux et of = 100 pour WinNT. 


(a) Que devient la statistique de test utilisée au point 2.7? 
(b) Quelle est sa distribution ? 


(c) Quelle taille d’échantillon faudrait-il pour garantir une puissance de 
80 % afin de détecter des différences de durée de 10 minutes? 


Test du chi-carré 


8.31 


Une étude à examiné le lien qui existe entre le fait de fumer et le fait d’être 
droitier ou gaucher. Un échantillon de 400 gauchers a révélé que 190 fumaient, 
alors que dans un échantillon de 800 droitiers on a trouvé 300 fumeurs. Tester 
si la proportion de fumeurs est identique dans les 2 catégories. 


8.32 


Le score Z d’un test d'intelligence est supposé être distribué selon une loi 
normale de moyenne w — 100 et de variance a? — 225. Un échantillon de 
1 000 personnes est testé. On obtient les scores suivants 


Score  [0,70) (70,85) [85,100) [100,115) [115,130) [130,00) 
Nombre 34 114 360 344 120 28 


Sur la base de cet échantillon, tester au seuil & = 5 % que la variable Z suit 
une loi W(100,225). 


8.33 


À la suite du croisement de 2 lignées d’une certaine variété de plantes, on 
devrait obtenir 75 % de plantes à fleurs rouges et 25 % de plantes à fleurs 
blanches, si la couleur obéit à la loi de Mendel. Pour vérifier si cette loi s’ap- 
plique à la couleur des fleurs dans le cas présent, nous avons mis en culture 
500 plantes, dont 350 ont donné des fleurs rouges. Peut-on affirmer que la loi 
de Mendel à été respectée ? 
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8.34 


On considère ici les évaluations fournies par les étudiants au cours de Sta- 
tistique de l’Université de Genève. Pour chacune des 2 questions ci-dessous 
justifiez votre réponse par un test d’hypothèse. Veuillez préciser quelle est l’hy- 
pothèse nulle, quelle statistique de test vous utilisez et quelle est la conclusion. 
Fixez le seuil & à 5 %. 


1. À la question sur l’organisation générale du cours, 12 étudiants se sont 
dits très satisfaits, 17 satisfaits, 19 mitigés, 11 insatisfaits et 8 très in- 
satisfaits. Peut-on affirmer, au vu de ces résultats, que les réponses sont 
uniformément distribuées parmi les 5 possibilités de réponse? 

2. Les réponses concernant la relation entre les étudiants et le professeur 
sont résumées dans le tableau ci-dessous 


DT Bonnes [Moyennes [Mana 


Hommes 12 13 8 

Femmes 17 10 7 
Peut-on affirmer, au vu de ces résultats, que l’appréciation du professeur 
par les hommes est différente (indépendante) de celle des femmes? 


8.39 


Pour comparer 2 bières on fait une expérience avec 100 amateurs de chaque 
marque. Chaque groupe affirme connaître la différence entre les 2 et préférer 
nettement la sienne. On demande à chaque sujet d’identifier sa préférence, après 
avoir goûté les 2. Voici les résultats. 


habituellement boivent 
B total 


ont 45 110 
préféré | B 55 90 
100 100 


Est-ce que l’habitude et la préférence sont des caractères indépendants ? 


8.36 


Un pronostiqueur a observé les résultats de 144 courses de chevaux. Le 
tableau suivant donne le nombre de vainqueurs pour les 8 positions de départ 
numérotées de l’intérieur vers l’extérieur. 


Dotnet [1]2/5[1l5/6]7/5. 
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En supposant que tous les chevaux ont les mêmes capacités, on aimerait 
savoir si chaque concurrent a autant de chance de gagner la course (indépen- 
damment de la position de départ). 

1. Définir l'hypothèse H5 à tester. 

2. Choisir le bon test. 

3. Calculer la p-valeur et conclure. 


8.37 


Le tableau suivant (extrait de Marketing Research, de À. Parasuraman, 
Addison-Wesley, 1986) reprend des données concernant le niveau des dépenses 
mensuelles pour l’achat de produits cosmétiques observé sur un échantillon 
aléatoire simple de 500 femmes adultes différenciées selon leur statut profes- 
sionnel. 


CTP temp [om partie 
Noms de 0 3 [| 2% | ® 


Del08a%8| #5 | 4 | _®& | 
Pisdzs | #% | # | # | 


Sur la base de ce tableau, peut-on dire qu’il y a indépendance entre le niveau 
de dépenses et le statut professionnel (utilisez un risque de 1"° espèce à = 5 %)? 

Quelle recommandation peut-on faire sur cette base aux responsables du 
marketing de produits cosmétiques ? 


8.38 


Mille personnes ont été classifiées selon leur sexe et selon le fait d’être dal- 
tonien ou pas. Les résultats sont les suivants. 
[_ [nomme femme | tom 
normal 442 514 956 
daltonien 38 
480 


6 44 
000 
1. Peut-on affirmer que le fait d’être daltonien est indépendant du sexe d’une 
personne ? 


2. Selon un modèle génétique les chiffres dans le tableau précédent devraient 
avoir des fréquences relatives données par le tableau suivant 


7 + pq 


SSI 


où q est la proportion des daltoniens dans la population et p + q = 1. 
Est-ce que les observations sont cohérentes avec ce modèle? 
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8.39 


Un grand fabricant de cigarettes désire savoir si le fait de fumer est lié à la 
consommation de chocolat. Mille personnes sont questionnées et les résultats 
sont les suivants: parmi 600 mangeurs de chocolat, 200 personnes ne fument 
pas et 100 personnes ne consomment ni chocolat, ni cigarettes. 

Quelles conclusions statistiques peut-on tirer de ce sondage ? 


8.40 


Ayant soupçonné que certains postes sont inaccessibles aux femmes, le col- 
lectif des femmes d’une société engage un statisticien pour mener une étude sur 
la répartition des postes suivant le sexe. Ce dernier recueille un échantillon de 
166 personnes présenté dans une table de contingence entre le secteur d'activité 
des personnes et leur sexe. 


CS Jones [ou 


Cavie [8 | 7 [x 
Durs [40 | 5 | # | 


Que va conclure le statisticien au vu de ces résultats (au niveau a = 5 %)? 


8.41 


Quatre marques de peinture sont comparées. Les marques À et B sont 
meilleur marché que les marques Cet D. Plusieurs plaquettes sont peintes puis 
exposées pendant 6 mois aux conditions météorologiques. Chaque plaquette est 
ensuite jugée selon différents critères et un score lui est attribué. 


peinture scores 


84 86 91 93 84 88 
90 88 92 84 94 


86 87 85 91 93 
81 83 92 84 87 81 


Construire une statistique de test basée sur la variance pour tester l’hypothèse : 
« les 4 marques de peinture ont le même comportement face aux intempéries. » 
Quelle est votre conclusion ? 
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Régression linéaire 


8.42 
Soit le modèle de régression 
VE. = 0x? + €, 
pour i=1,...,n. On fait l'hypothèse que les erreurs €; sont indépendantes et 


distribuées selon la loi normale avec espérance 0 et variance o?. 


1. Donner la distribution de Y;. 

2. Calculer l’estimateur des moindres carrés de 4, son biais et sa variance. 

3. Calculer l'information de Fisher J (8) par rapport à la distribution con- 
jointe de (Y1,...,Ÿ,) et en déduire la borne de Cramér-Rao pour des 
estimateur sans biais. 

4. Donner l'efficacité de l’estimateur des moindres carrés. 

5. Donner un intervalle de confiance au degré (1 — a) pour 4 basé sur la 
statistique (3%. r?2Y:)/ 3, æé. 


8.43 


On considère le modèle de régression simple 
YM=a+brite, i=1,...,n 


OÙ €1,...,€n Sont n variables aléatoires telles que €; + W(0, a?). 
1. Construire des intervalles de confiance pour @ et 6. 
Indication : utiliser l'exercice 7.2. 
2. Tester l'hypothèse H, : 5 = 0. 


8.44 


Est-ce qu'il y a un lien entre l'intelligence et la taille du cerveau ? Une 
étude de Willerman et al. (1991) a étudié cette question en mesurant le QI 
(Performance IQ de Wechsler (1981)) et la taille du cerveau (TC, mesurée par 
résonance magnétique) de 40 individus. On suppose le modèle de régression 
suivant 

QI; = a+ BTC; + €, 
pour à = 1,...,40, où €; est le terme d’erreur tel que E(e;) = 0 et Var(e;) = a?. 
Sur la figure 8.2 sont représentées les données. 

En sachant que l’estimation par la méthode des moindres carrés donne 
àmc = 1,74, Bmc = 0,00012 et 6 = 20,99, veuillez répondre aux questions 
suivantes. 

1. Quelle est la valeur estimée du QI pour un individu pour lequel TC = 

910 000? 
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Vous étudiez le marché de l’immobilier à travers la relation entre le loga- 
rithme du prix de vente d’une maison Y; — log(p;) et l’âge de la maison #;, 
i = 1,...,n. Sur les données dont vous disposez, vous ajustez un modèle li- 


8*1015 8.50*1015 9*1015 9.50*1015 1076 1.05*1016 
TC 


Fig. 8.2 — Représentation des données de l'exercice 8.44. 


457 152, où Sos = D 7 (ti — F)°.) 


que 5 est significativement différent de 0? 


8.45 


néaire 


Yi = a+ Br; +e;, 


ce nouveau modèle. 


i=1,.… 


,n. 


Le graphique des résidus se présente selon la figure 8.8. 


. Est-ce qu'il s’agit d’un bon ajustement ? Expliquez. 


2. Donner un intervalle de confiance pour 8. (Utiliser le fait que VW S3x — 


3. Est-ce que le QT dépend de la taille du cerveau? Autrement dit, est-ce 


. Si le modèle précédent n’est pas satisfaisant, proposez-en un meilleur. 
. Ecrivez les équations d’estimation par la méthode des moindres carrés de 


8. Inférence 197 


LS 
e 
OQ 
ao 
e 
CE e s 
a 
e 
a 
œ 
3 
mL Sul “ 
ŒE: 7 ne 
e. 
o ©: Er 
ul 
® ? ° 
e e 
e) RS e° 
e - CE) 
T T T T T T 
-20 0 20 40 60 80 
Fitted : xstat 


Fig. 8.3 — Représentation des résidus de l’exercice 8.45. 


4. Donnez une interprétation de ce modèle dans le cadre du marché de l’im- 
mobilier. 


Exercices combinés 


8.46 


Dans le cadre d’une étude de marketing, on analyse la consommation de 
lessive des ménages. Sur la base d’un échantillon aléatoire simple de 100 mé- 
nages, on à observé une consommation moyenne de 14 kilos avec un écart-type 
estimé s de 2 kilos. D’autre part, 30 % des personnes interrogées accordaient 
leur préférence à un produit sans phosphates. 


1. Construire un intervalle de confiance à 95 % pour l’espérance de la quan- 
tité consommée de lessive. 

2. Un fabricant affirme que 25 % des ménages préfèrent la lessive sans phos- 
phates alors que le consultant responsable de l’étude estime qu’il y en 
a plus que 25 %. Réaliser un test pour départager ces deux opinions. 
(Utiliser un risque de 1° espèce à = 5 %.) 
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8.47 


Pour modéliser les valeurs extrêmes d’une action, on peut utiliser la loi de 
Gumbel. Sa fonction de répartition est 


F(&) = exp (-a (-=)) | 


Soit X1,...,X, un échantillon d'observations indépendantes telles que chaque 
X;rF. 
1. Calculer l’estimateur des moments pour & et 6. 
Indication : E(X;) = £+ V0 et V(X;) = T0, avec 7 = 0,57722. 
2. Les estimateurs sont-ils convergent ? 
3. L’estimateur des moments pour 0 est-il biaisé ? 
Pour les questions suivantes, on suppose que 0 — 6. 

4. En utilisant l’estimateur des moments pour €, construire un intervalle de 
confiance au degré de confiance (1 — a) pour le paramètre 6. 

5. Exprimer le 0,9-quantile de la distribution de Gumbel en fonction des pa- 
ramètres € et 0 = 6, et trouver un estimateur de ce quantile en remplaçant 
£ par son estimateur des moments. 

6. En utilisant 5., dériver un intervalle de confiance au degré de confiance 
(1 — a) pour le 0,9-quantile de cette distribution. 

7. On dispose de 20 observations historiques sur les valeurs extrêmes de 
l’action entre 1978 et 2000. La moyenne de ces valeurs est 372,05 € 
Calculer la valeur estimée du 0,9-quantile. 

8. L’année passée, on a observé une valeur maximale de l’action de 374,80 €. 
Au vu des données disponibles, peut-on considérer le niveau maximal 
atteint par l’action comme exceptionnel? 


8.48 


Soit X1,...,X, un échantillon de n variables aléatoires qui proviennent 
d’une distribution exponentielle avec densité 


1 zx 
f(@) = exp (—2) 
us x > 0 et avec 0 > 0. On considère les 3 estimateurs suivants de 4: 


NC 2 = D Xi/(n +1), et Ü3=n-min(X1,...,Xn). 


1. Calculer l’espérance et la variance de ô. et de Üz ainsi que leur erreur 
quadratique moyenne. 

2. De même pour Ôs. Comparer l'efficacité de ces 3 estimateurs du point de 
vue de l’erreur quadratique moyenne. 
Indication : trouver la distribution de Y = min(X1,..., X,), c’est-à-dire 
calculer P(Y < y). De quelle loi s'agit-il? 
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3. Les estimateurs ô. Üo, Ü; sont-ils convergents ? 
4. Définissons l'intervalle de confiance suivant pour À = 1/0 


I ={a/min(X;) ,b/min(X;)|. 


Calculer le degré de confiance de cet intervalle en fonction de a et de b. 
Indication : montrer que Z = À: min(X;) est distribué selon la loi expo- 
nentielle de paramètre n et utiliser ce résultat. 


8.49 


Soient X1,...,X, des variables aléatoires indépendantes et identiquement 
distribuées selon une loi uniforme U(0 ,4). On définit les statistiques suivantes 


ô. = 2X et Ô = max(X1, es N) 


1. Montrer que Ô: est un estimateur non biaisé de 0. 

2. Calculer l’espérance de bo. puis en déduire un estimateur non biaisé de 0 
que l’on notera Üs. 

3. Comparer l'efficacité des ces 3 estimateurs du point de vue de l'erreur 
quadratique moyenne. 

4. Les estimateurs ô. Üo, CE sont-ils consistants ? 

5. On considère 2 candidats pour construire un intervalle de confiance pour à 


Li =[aô2 , b62] et B={[0+c,02+d, 
avec 1<a<be0<c<d<0. 


(a) Quel est le taux de couverture de 11, c’est-à-dire la probabilité que 
0 € T1 (en fonction de a et b)? 

(b) De même, quel est le taux de couverture de Z2 (en fonction de c 
et d)? Qu’observez-vous par rapport à 11? 

(c) Si on prend b — 2a dans 11, comment faut-il choisir a pour que le 
taux de couverture soit égal à 95 %? 


8.50 


On dispose des résultats d’un test auquel on a soumis n personnes pendant 
les dernières années. Chaque personne pouvait se présenter au test plusieurs 
fois jusqu’au succès. 

Soit 0,0 < 0 < 1, la probabilité qu’une personne de cette population réus- 
sisse le test lors d’un essai et X la variable aléatoire qui représente le nombre 
d'essais indépendants nécessaires jusqu’au succès. 


1. Interpréter le modèle de probabilité 
P(X=Rk)=0.(1—0) 1 k=1,2,3, 
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2. On dispose des données k1, ...,k, concernant le nombre d'essais effectués 
par chaque personne jusqu’au succès. Calculer l’estimateur du maximum 
de vraisemblance 0 pour 6. 


3. Donner une approximation de la variance de û) MV. 
4. Calculer l’estimateur des moments pour 0 sur la base de k1,...,ky. 


5. En utilisant le modèle 1., exprimer la probabilité que plus de 2 essais 
soient nécessaires pour réussir le test. 


6. Sur la base des données disponibles la moyenne observée du nombre d’es- 
sais est & — 3,3. Utiliser les résultats obtenus aux points 2. et 5. pour 
estimer la probabilité que dans le futur plus de 2 essais soient nécessaires 
à une personne pour réussir le test. 


7. Sur la base des données k1, ...,k, on souhaite tester l’hypothèse nulle 
H5 : 0 — à contre l’alternative H À : 0 — 2. Un analyste propose d'utiliser 
q) Mv comme statistique pour effectuer le test. S'agit-il d’un choix optimal ? 
Si cela n’est pas le cas, proposer une meilleure statistique. 

8. Proposer une façon de calculer la valeur critique approximée du test op- 
timal obtenu au point 7. 


8.51 


Un syndicat de boulangers fait une enquête sur la consommation mensuelle 
de pain chez les ménages de plus de 2 personnes. Cette consommation, exprimée 
en kilos, est désignée par X. Cent ménages qui ont bien voulu se prêter à 
l'enquête sont suivis pendant 1 mois, et on note pour chacun d’entre eux la 
quantité totale de pain consommée. On obtient ainsi un échantillon aléatoire 
relatif à la variable X. 


1. Pour cet échantillon, on trouve une moyenne estimée 7 = 21,5 kilos et 
un écart-type estimé s = 1,8 kilo. Donner un intervalle de confiance au 
niveau 95 % pour y = E(X). 

2. Ces données permettent-elles de rejeter l'hypothèse nulle A6 : y = 21 
contre À; : u £ 21 au seuil & = 5 %? 

3. Sur les 100 ménages, 23 ont consommé moins de 20 kilos de pain dans 
le mois. Donner un intervalle de confiance à 95 % pour la proportion de 
ménages qui consomment mensuellement moins de 20 kilos de pain. 


4. Un boulanger du quartier fait une enquête analogue, mais il n’a pu s’assu- 
rer que de la coopération de 11 ménages. Il voudrait obtenir un intervalle 
de confiance pour y = E(X) au niveau de 95 %. On suppose que sur 
son échantillon, il a obtenu Z = 21,5 kilos et s = 1,8 kilo. Construire un 
intervalle de confiance au niveau de 95 % pour y. Comparer ce dernier 
avec l'intervalle trouvé en 1. et discuter. 
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8.92 


Dans le cadre de la modélisation de distributions de revenu, on utilise sou- 
vent la distribution de Dagum qui est définie par la fonction de répartition 
suivante 


oùxz>0et B>0. 

1. Sur la base d’un échantillon X,...,X, de revenus, calculer l’estimateur 
du maximum de vraisemblance ô pour le paramètre 6. 

2. Calculer l'information de Fisher de ce modèle et donner la distribution 
de 4n(8 — B) lorsque n — . 

3. On génère à l’ordinateur 100 000 échantillons de 16 observations suivant la 
loi de Dagum avec paramètre 8 = 1. Pour chaque échantillon, on calcule 
la valeur de l’estimateur ô . Donner le nombre approximé d’échantillons 
où la valeur de l’estimateur se trouve dans l'intervalle [0,5, 1,5]. 

4. Construire un intervalle de confiance approximé au degré 95 % pour 6. 
Indication : utiliser le résultat du point 2. et la distribution de Va(£ — 1) 
lorsque n — co. 


8.53 


Soient X1,...,X, un échantillon de n variables aléatoires indépendantes 
qui proviennent d’une distribution dont la densité est 


ax? si0<r<li 
fan = { 


0 sinon, 
où «a > (. 
1. Calculer l’estimateur des moments à» de & et l’écrire comme une fonction 
àm = g(X). 


2. En utilisant le théorème central limite, donner la distribution approximée 
de /n(X — u), où u = E(X). 
3. Donner une approximation de la variance de 4 en utilisant le résultat 


O0 0) NT ( (5e) #) 


où a? est la variance de /n(X — y) calculée au point 2. 
4. L’estimateur à est-il convergent ? Justifier votre réponse. 


a 


L’estimateur àm est-il efficace? Justifier votre réponse. 
6. À l’aide du résultat du point 3., construire un intervalle de confiance 
approximé au degré 95 % pour le paramètre a. 
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8.54 


Soient X1,...,X, des variables aléatoires indépendantes telle que X; + 


Nu, 0?) avec a 


? connu. On veut tester l'hypothèse nulle H6 : p — uo contre 


l'alternative HA : p > jo à l’aide de la statistique X. La p-valeur observée est 
définie par pv = Pr, (X > &), où & est la valeur observée de la statistique. 


1. 


Expliquer pourquoi la statistique X est une bonne statistique pour tes- 
ter Ho. 


. Écrivez pv comme une fonction g(&, do, o,n) à l’aide de ®(.), la fonction 


de répartition d’une distribution W(0, 1). 

On considère maintenant la variable aléatoire PV = g(X, uo,o,n). Cal- 
culer sa fonction de répartition et sa densité sous une alternative u — 
H(> bo). : 

Indication : développer P,, (PV > a) = P,,(g(X, ho,o,n) > a) pour une 
valeur de a donnée. 


. Quelle est la distribution de PV quand 1 = Ho ? 


8. Inférence 203 


Corrigés 
6.1 


On a un échantillon de taille n = 13 avec 7 + 14,3 et on sait que © = 4. 

1. Par le théorème central limite, on fait l'hypothèse que la variable aléa- 
toire X suit approximativement une loi normale de paramètres (0,1). Par 
conséquent, on trouve l'intervalle de confiance à 95 % suivant 


ide ra zooms | = [12,1 ; 16,5]. 


2. Si l'intervalle est de longueur 3, alors 


© 


FN = 1,5 


et 
Z1-a/2 1,385 & aZ0,18. 


On obtient un niveau de confiance de 82 %. 


3. On aimerait que 
o 


—= = 1. 
20,995 Vn 


Cela implique que 
nn — (20,9950)° 106. 


Il faut par conséquent 93 observations additionnelles. 


84 


1. La variable aléatoire À, suit une loi normale car elle est une somme de 
variables aléatoires normales. Son espérance est 


= E 5 2) —= ÿ a E(R;i) —= ÿ dilli — Up 
i=1 i=1 i=1 
et sa variance 
var(R,) = var > sn) - > af var(R =Y a; 0? = = . 
i=1 


La variable aléatoire R, est distribuée selon une loi normale de para- 
mètres (Up, 0%). 
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2. On cherche un intervalle de confiance à 95 % pour u,. Comme R, suit 
une loi normale 


Rp 


— ji 
21-02 LEE € 71 ùf2; 


alors 


IC — S. a R; LE 
i=1 


3. L'application numérique donne l’intervalle de confiance [0,076 : 0,092]. 


8.3 


1. On cherche un intervalle de confiance pour la moyenne de la baisse de 
puissance de la fabrication. Par le théorème central limite, on sait qu’ap- 


proximativement 
X — 
E À N(0,1), 
o/Vn 
où u et o? sont l'espérance et la variance de chacun des X;. Pour un 


intervalle de confiance à 95 %, on va donc chercher un nombre a tel que 


P( a) = 0,95. 


be 
Re 
o/Vn 
Par le théorème central limite, on trouve 


= H 
o/Vn 


De ce résultat, on déduit l'intervalle de confiance suivant pour y (avec les 
valeurs des paramètres de l'énoncé) 


<a)=2®(a)—1=0,95 & a—1,9,6. 


IC — T0 T+o = [11,56 ; 12,44]. 


L’intervalle [11,56 ; 12,44] contient y avec une probabilité de 95 %. 

2. On procède de la même manière qu’au point 1., mais avec un intervalle 
de confiance à 99 %. Dans ce cas, a = 2,58 et l’intervalle qui contient y 
avec une probabilité de 99 % est [11,42 ; 12,58]. 

3. Le 2° intervalle, qui mesure 1,16, est plus long que le premier (0,88). 
Cela s'explique par le fait que la précision diminue lorsque la certitude 
augmente. 
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8.1 
Soit à l’estimateur de y tel que 


ER 
= A+. 


Les variables aléatoires X; et Y; suivent des lois normales de variances connues. 
Pour calculer l'intervalle de confiance basé sur Z, il faut calculer sa variance 


var(à) = var + Y)) = z (art )+ var(P)) 


1 fo? o2 1 
Sete le -Caro) 
4a\n n An 


où l’on a utilisé l’indépendance des X; avec les Y;. L’intervalle de confiance est 
par conséquent 

des 22 À O2 + 02 

ZX +Y) +22 ao EE |. 

AL FF) 9 71-a/2 = 
8.5 


1. On sait que E(X;) = 2/À. Pour calculer la variance de X;, il faut connaître 
E(X}) 


IC — Là E Z1-a/2 var()| — 


EX) = ji x? 2x exp(—Àx)dx = x | x exp(—X\x)dr. 
0 0 
L'intégrale se fait par parties 
OO OO 1 
x | z° exp(—Àx)dx — sx | x? G exp) dx. 
0 0 


Soit Z une variable aléatoire suivant une distribution exponentielle de 
paramètre À. L'intégrale précédente est alors égale à l'espérance de Z2. 
Comme var(Z) — 1/X? et E(Z) = 1/X, on en déduit que E(Z?) — 
var(Z) + E?(7) = 2/X2. Finalement 
2 2 2 
E(XŸ) = 3À x 6 
Ce résultat permet d'obtenir var(3;_, X;) en fonction de y 


var(S Xi) = nvar(X;) = n(E(X?) — E?(X;)) = n(6 — p?). 
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2. Par le théorème central limite 


DE Xi 20e Xi) 
var() Xi) 


avec a = 5 %. D’après les résultats du point 1., 


Di Xi np 
PE 
1 /2 Vn/2u L /2 


—Z1-a/2 < < 21-a/2: 


donc 
A Fr 
D <y < ic | 
n+1n/22-a/2 n— 1/n/22-a/2 


8.0 


La demi-longueur a de l'intervalle de confiance au degré (1 — &) est 


1 — 
ds _— 


où p est la vraie proportion de personnes favorables à la proposition, n la taille 
de l'échantillon et 1-2 le (1— +) quantile de la distribution W(0,1). La demi- 
longueur maximale est obtenue pour p = à 


a —= 21-22 


1 
72/1 
1. Dans ce cas (1—a) = 95 %, 21-32 = 20,975 = 1,96, a — 0,10/2. On obtient 


ñ = As = 384 
7 4e É 


L'étude n’est donc pas faisable à ces conditions. 


2. Ici 21-2 = 2aÿ/n = 20,05 - V200 = 2 + 1,412. 
Donc 1 — % = 0,92, a = 0,16 et 1 — a = 0,84. 


8.7 


Par le théorème central limite, on a 
Fu 
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lorsque n — oo. Avec u = 5, o = 1 et n — 100 on obtient donc 


P(Ÿ -01<5<Ÿ+0,1) = P(-01<Ÿ-—5<0,1) 


1/V100 1/V100 
= P(-1<Z<1) 
2. P(Z <1) 
— 0,682. 


Sur les 1 000 échantillons simulés, 682 intervalles de la forme [Ÿ — 0,1; Ÿ +0,1] 
contiendront la valeur 5. 


8.8 


1. Le degré de confiance est la probabilité de couverture de l'intervalle de 
confiance, c’est-à-dire la probabilité que u appartienne à l’intervalle 


Phones à) + (acte) 
u P(n<TE< u) 
= D(b)- &(-h), 


où ®(-) est la fonction de répartition de la loi normale centrée et réduite. 
2. La longueur de l'intervalle de confiance est 


__. bo bi il 
2 lo ee 
me (6-2) te) 
On veut donc minimiser (b1+0b2) sous la contrainte D(b1)—®(—b2) = 0,9. 
Construisons le lagrangien £ 


L = bi + ba + A[D(b1) — P(—b2) — 0,9], 


où À est un multiplicateur de Lagrange. La minimisation de £ donne le 
système suivant 


OL Tr 

ETA — 1 TT ÀA® (b1) —— 0 

ô£ , 

nr 1+ AP (—b2) = 0 

OL 

OX — ®P(b:1) er ®P(b2) LS 0,9 _— 0, 


qui, par différence de ces 2 premières équations, conduit à 


D'(b1) = —D'(—b). 
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On dérive les 2 membres de cette égalité et on obtient 


g(bi) = p(—b2), 


où w(:-) est la densité de la loi normale centrée et réduite. Par symétrie 
de la fonction w(-), on obtient 


bi = b2 = b. 
La contrainte implique alors 
D(b) — P(—b) — P(b) — (1 — P(b)) = 2D(b) — 1 = 0,9 
& D(b)=0,95 &b=1,64. 


Les valeurs qui minimisent la longueur de l'intervalle sont b1 = b2 © 1,64. 


6.9 
1. Pour déterminer l’estimateur des moments, il faut d’abord calculer son 
espérance 
O(k+1) O(k+1) æ 
E(X) ji f(x) Î De FR Rs l, 
= xf(x)dx — —dx = — = . 
G] 20 |,_9y 2 
0h 0h 
L’estimateur doit satisfaire 
2k+1 : = 
= X 
2 M ; 
donc One = +. 
Puisque 
li û) Re + 7 E(X;) 
— ——— im = ——— â == 
Fe ne DRE Cor dE 
2 2k+1 
HET. gr va 
l’estimateur 0x est convergent. 
2. L’estimateur 0», est sans biais et sa variance vaut 
. 4 = 4 var(X;) 
—= RTS EEE X EE ——————  — 
var(8u) Ge OO GED n 
. 4 1 0? 
7 (2k+1)2 n 12 
02 


Bn(2k + 12 


8. Inférence 209 


On a 


0e? 


ECM(ôm, 0) = var(Ôn1) + biais (dr, 0) = 3n@K + 12 


3. Puisque Üm est fonction de X , la distribution asymptotique de Ôm s’ob- 
tient à l’aide du théorème central limite 


mu — E(ô) 


var(Ôn1) 


 N(0,1) 


Üm — 0 
o 
(2k+1)V3n 


 N(0,1) 


4. Pour construire l’intervalle de confiance, on utilise le résultat du point 3., 
d’où l’on tire que 


Üm — 0 
20,975 < gg — < 20,975 
(2k+1)V3n 
et ensuite 
1,96 Ô 1,96 
Rp 


(2k+1)V3n 0 (2k+1)V3n 


(2k+1)V3n-—1,96  OÜn _ (2k+1)Va3n + 1,96 


ChEDvVR © 0 CRiOvER 


(2k +1)V3n ôu 9e CA+1)Van EM 


(2k + 1)V3n + 1,96 (2k + 1)V3n — 1,96 
2V3n X 2V3n X 


———— —_—_— < 0 << ————— 
(2k + 1)V3n + 1,96 (2k + 1)V3n — 1,96 


5. La longueur de l'intervalle calculé au point 4. est 


HE = 2V3n X 2V3n X 
 (2k+1)2V3n-—196  (2k+1)V3n +1,96 
4-1,96V3nX 


3n(2k + 1)? — (1,96)? 


Il s’agit d’une fonction décroissante en k: si & augmente, {(k) diminue. 
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8.10 


1. Puisque X; suit une loi Gamma de paramètres (3,4), son espérance est 


2. Pour construire un intervalle de confiance pour y, on utilise le théorème 
central limite = [ae 
X — E(X) 


var(X) 


 N(0,1), 


avec E(X) = 3/0 et var(X) = 5. Ainsi, pour un intervalle de confiance 
à 95 %, on obtient 


X 5 
—1,96 < < 1,96 


& —1,9%6 < ‘ec — Vin < 1,96 


& IC- Ë Æ DE . 
X n X 


Avec n = 100 et T — 6, l'intervalle devient [0,444 ; 0,556]. 


8.11 


Soit æ; la 4° mesure avec à = 1, ...,9. 

1. La moyenne de l'échantillon est 7 = 1,02. 

2. Pour déterminer un intervalle de confiance pour u = E(X), on fait 
l'hypothèse que X suit approximativement une loi normale de para- 
mètres (1,02,0,09). Ainsi, l’intervalle de confiance à 95 % pour y est 


ide Fr se za or = [0,82 ; 1.22], 
où 20,975 © 1,96 est le 0,975-quantile de la loi normale centrée et réduite. 


3. Pour réduire la taille de l'intervalle de confiance, le biochimiste doit aug- 
menter la taille de l’échantillon ou réduire le niveau de confiance. 
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aie 


Premier cas. 

1. Les hypothèses sont 
Ho : u=18 
IA : u<18. 


2. Soit la statistique de test T — X, avec X1,..., X10 les temps mesurés. 
Calculons la p-valeur 


p-valeur = Pa, (T < 17,13) = 


AE 
= P (z _ Le = P(Z < -1,83) = 0,03, 
1,5/VT0 


où Z = TH suit une loi normale de paramètres (0,1) sous l'hypothèse 
de normalité des X;. Ce résultat implique que si le seuil a été fixé à 5 %, 
on rejette l’hypothèse nulle, et que s’il a été fixé à 1 %, on ne la rejette 
pas. 


Deuxième cas. 


1. Les hypothèses sont cette fois 


Ho : = 100 
HA : p<100. 


2. Soit la statistique de test T — X, où X1,..., X14 sont les surfaces mesu- 
rées. La p-valeur est 


p-valeur = Pr, (T < 99,9) = 


— 1 

= P (z < ET  P(Z < —0,07) = 0,47, 
5/V14 

Tu 


avec Z = = TE qui suit une loi normale de paramètres (0,1) sous l’hypo- 


thèse de normalité des X;. Pour un seuil & = 5 %, on ne rejette pas 
l’hypothèse nulle. 


8.13 
1. Les hypothèses formulées sont 


Ho : u=14 
Ha : m>1,4 


2. On définit la statistique de test 
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La statistique T' suit une loi normale centrée et réduite. La valeur observée 
tws de la statistique sur l’échantillon est 


l79 14 
RS sf ot 
#7 1,02/V25 


Le quantile à 95 % de la loi normale vaut environ 1,96 et est supérieur à 
la valeur observée. On ne rejette donc pas l’hypothèse nulle. 


3. Le quantile à 99 % vaut environ 2,49. Encore une fois, l'hypothèse nulle 
n’est pas rejetée. 


8.14 


Soit la variable aléatoire X,; telle que 


O si l'enfant à est une fille 
Xi = 5e 
1 si l’enfant à est un garçon, 


et définissons Y = 5, X;. La variable aléatoire Y suit une loi binomiale de 
paramètres (512,p), où p est la probabilité qu’un nouveau-né soit un garçon. 
On désire tester l’hypothèse H5 contre HA telles que 


Ho : p—=1/2 
Ha : p>1/2. 


On va calculer la p-valeur. La distribution exacte est connue, mais nous allons 
voir que le calcul de la probabilité serait laborieux si on ne disposait pas d’un 
ordinateur. Par conséquent, la distribution de Ÿ est approximée par une loi 
normale centrée et réduite en appliquant le théorème central limite. 


ale P S X; > 284 P nn À; — np 284 — np 
p-Valeur — H, i = Py Li UP 284 np 

=  P(Z > 2,48) = 0,007, 
où Z est distribuée selon une loi normale de paramètres (0, 1). On rejette donc 


au seuil de 5 % l'hypothèse affirmant que les filles ont autant de chance que les 
garçons d’être prématurées. 


8.15 


Soit X le nombre d’accidents par année, X + P(À). L'hypothèse nulle est 
H5 : À =8 et on observe X = 5. La p-valeur est 


p— valeur — Py,(X <5) 
_ es (1+8+8 +848) +010. 


8. Inférence 213 


Par l’approximation normale 
PP 


e (CR 
p — valeur = FH, EE nl 
8 V8 


Le test n’est pas significatif au seuil de 5 % et l'hypothèse nulle n’est pas rejetée. 


) = &(—1,0607) & 0,14. 


8.16 


Les hypothèses sont 
Ho : u=3,l 
HA : m>3,1. 


La moyenne et l’écart-type estimé de l'échantillon sont X = 3,26 et 6 — 0,24. 
Soit la statistique de test 

= 

6/Vn 

La statistique T suit une loi de Student à n — 1 degrés de liberté. La valeur 
observée t,4, sur l'échantillon est 


. 3,26 —3,1 
57 0,24/V9 
Les quantiles à 95 % et 99 % d’une loi de Student à 8 degrés de liberté valent 
respectivement 1,86 et 2,9. Par conséquent, le docteur Fischbach rejette l’hy- 


pothèse nulle avec un seuil à 5 % et ne la rejette pas s’il choisit un seuil à 


1%. 


8.17 


1. Sous Ho, + 55, (Xi — X)? suit une loi x? à (n — 1) degrés de liberté. 
2. On cherche k,, tel que 


Pn(6° < ka) = 0,95 


et, en utilisant le point 1., on trouve 


, Lie _ 
Pa(ô? <ka) = Pr ENS XVe ) 
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avec U + x2_1. À l’aide du quantile à 95 % X2-1: 0,95: On détermine k, : 


8.18 


Soit D; la différence de poids entre 2 agneaux de la paire 4; on fait l’hypo- 
thèse que D; suit une loi normale d’espérance y et de variance o?. Soient les 
hypothèses suivantes 

Ho : HU — (0) 
HA : Æ 0 


et T' la statistique de test définie par 


avec 8 = 5% ,(D; — D}? et n la taille de l'échantillon. La statistique T 
suit une loi de Student à 11 degrés de liberté. On observe sur l'échantillon 


VT2(—10,58) | 


bots © D — 
; 12,24 B 


et la p-valeur correspondante est 
p-valeur + P(|T |> 3) = 0,006. 


On rejette l'hypothèse nulle au seuil de 5 % ce qui signifie que les régimes 
alimentaires sont différents. 


8:19 


On considère les variances comme étant égales. Soient les hypothèses 


Ho : HA—=HRB 
HA : WA HE. 


On choisit la statistique de test T' définie par la relation 


X -Y 
T = —=—— 
&/++t 


L 
m 


où m et n sont la taille des échantillons et 
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Sous l'hypothèse nulle, la statistique T suit une loi de Student à m+n—72 degrés 
de liberté. Dans le cas de l’exercice, les valeurs observées sont m = n = 15, 
7 © 2,99, 7 = 2,90, 67 = 0,29 et 6% = 0,25. Ainsi, tops © 0,47 et la p-valeur est 


p-valeur = P(|T |> ts) © 0,64. 


On ne rejette pas l’hypothèse nulle, on ne peut pas affirmer que les moyennes 
des échantillons sont différentes. 


8.20 


1. 


3. 


Puisque les 2 échantillons sont indépendants et les observations issues 
d’une loi normale, nous effectuons un test de Student à 2 échantillons, 
pour tester 

Ho : us —=php 

HA : hs fun, 
où us (respectivement p) est le nombre moyen d’heures de sommeil 
additionnel pour les utilisateurs de Sopo (respectivement Dodo). 
On calcule ?p = 1,05, ïs = 1,89 et les écart-types estimés 67, — 1,60 et 
O4 — 3,15. La statistique de test observée est 

Ts —Zp 1,03 — 1,05 


OR ——— 
62+67 1,60—3,15 
n 10 


Puisque le quantile 0,975 de la loi to est égal à 2,26, on n’a pas assez 
d’évidence pour rejeter Ho. 
(a) Définissons la différence À = y — up. On teste alors 


= 1,22 


Ho : A=0 
H4 : AO 
avec la statistique de test 
D 
T = — 
£a 
Va 


où D; = X5—XP, D = X5— Xp et 64 = 1/(n—-1) >%_.(D;- D). 
Sous H9 on a que T < t(n_1). 
La valeur observée de la statistique sur l’échantillon vaut 


0,84 


Lobs — 
0,56 
10 


ce qui est plus grand que {0,975:59 = 2,26, le quantile 0,975 de la 
loi t(n_1,. On rejette Ho au profit de H1. Il y a bien une différence 
entre les 2 somnifères. 

(b) Le dernier test est plus approprié que le premier parce que nous 
tenons compte de la physiologie de chaque individu. 


= 3,55, 
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S41 


L’échantillon provenant d’une loi de Poisson de paramètre À, on sait que 
E(X) = var(X) = À. On en tire les hypothèses de test 


Ho : À = )o = 25 
Ha : ÀZ95. 


La statistique de test est X et sa valeur observée 7 = 27. On se sert de la 
nouvelle variable aléatoire normale centrée et réduite Z définie comme 


ne 
VnÀ 
pour trouver la p-valeur 
X — 9 27 — À 


p-valeur = Pr, (= ne ) = P(|Z [> 2,19) + 0,029. 
0 0 


On rejette donc l'hypothèse nulle à 5 %, mais pas à 1 %. 


CP 


Soient les hypothèses 
Ho : = 300 
HA : u< 300. 
La valeur moyenne mesurée sur l’échantillon est de 299,03 mL. Soit la statistique 
de test _ 
nr 
on 
Sous l'hypothèse de normalité des X;, la statistique T suit une loi normale de 
paramètres (0,1). La p-valeur est 


p-valeur = Py,(X < 299,03) = 


2 = 
= P (r < = P(T < —0,792) = 0,21. 
3/V6 


On ne rejette donc pas l'hypothèse nulle. Pour déterminer la puissance du test, 
il est nécessaire de calculer la valeur critique k,, avec un seuil a = 5 % 


== S 
PalX eh) Pre |) 256 
Ho ( 0,05) ( 316 


Ko,05 — 300 


 —-164 &  k = 298. 
3/V6 0,05 
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On trouve la puissance du test 


= 298 — u 298 — u ) 
= Pr(X < 298) = PÎT< =? V6 ). 
Bu) = Pa, (R < 208) = P(r < PTE) = 8 (ÈS 
où ®(-) est la fonction de répartition de la loi normale. On obtient alors 
1. 8(299) + 0,21; 
2. 5(295) = 0,99; 
3. B(290) = 1. 


8.23 


Soit X1,...,X1 000 des variables aléatoires qui valent 1 si on obtient pile et 
0 sinon. Elles suivent une loi de Bernoulli avec probabilité p, p valant 1/2 si la 
pièce est bien équilibrée et 0,55 dans le cas contraire. La somme S = D X; 
suit alors une loi binomiale de paramètres (1 000, p). 

1. Si la pièce est réellement homogène 


S'— 500 525 — 500 
V250 V2 
où Z suit une loi normale centrée et réduite par approximation. 
2. Si la pièce est mal équilibrée 
S—550 525 — 550 
VAS VAS 


Les 2 résultats sont égaux parce que le nombre de piles mesuré se trouve exac- 
tement au milieu de l’espérance de $ pour chacun des cas, et les variances ne 
diffèrent que peu. 


P{S > 525) = P ( }=1-P(Z <158 +006 


P(S <525)=P ( ) = P(Z < —1,59) + 0,06. 


8.2] 


1. Les hypothèses formulées sont 
Ho : = uo = 450 
HA : p> 450. 


Soit la statistique de test X. La valeur observée est 7 — 461. Calculons 
la p-valeur 


+ = X — ho _ FH 
p-valeur H(X > T) (— en 
= P(Z > 2,46) = 0,007, 
où Z suit une loi normale de paramètres (0,1) par le théorème cen- 


tral limite. On rejette donc H6 et on accepte l'hypothèse alternative. 
En d’autres termes, on peut dire que la moyenne est supérieure à 450. 
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2. Pour déterminer la puissance du test X, il faut d’abord calculer le seuil 
critique k4 


ka — H0 LS 
o/yn 1-a 
Calculons à présent la probabilité d’erreur de 2° espèce 
= Xp. sn 
Pr,(X <ka) = P 
7 | cJVn on ) 
_ P(z< ML) 
o 


se hs 6 È A0 © 457,4. 


—10 
PTT < ——> +1,64 
( 100/500 ) 
m  P(Z < —0,59) = 0,28. 
La puissance du test au seuil de 5 % pour détecter une augmentation de 


10 points est donc 
B = 1—0,28 = 0,72. 


Cela signifie qu’on détectera une différence de 10 points environ 72 fois 
sur 100. 


8.25 
1. On formule les hypothèses suivantes 


Ho : pp = 1600 
HA : p<1600. 


2. Soit la statistique de test 


qui suit une loi de Student à n — 1 degrés de liberté. 
3. La valeur observée de la statistique est tps — 1 590 et la p-valeur corres- 
pondante 


= 4 
p-valeur = P(X < ts) = P (r < -) = 0,101. 


À un seuil de 1 %, on ne rejette pas l’hypothèse nulle. 
4. Commençons par déterminer la valeur critique k,. 


ko,o1 — Ho 
s/Vn 


Es Ko,o1 = 1 581. 


= tn_1:0,01 — —2,6 
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L'erreur de 2° espèce est 


Era — 1581 — 1570 
Pa,(X > k = Pr,(X > k = PIT> ————— |: 0,09, 
Ha ( 0,01) 'H à ( 0,01) ( 30/ VIS ) 


et la puissance du test 
B = 0,91. 


8.20 


1. La densité conjointe de l’échantillon est le produit 


fera (fe) (be) 


Pour trouver le test le plus puissant, on se sert du lemme de Neyman- 
Pearson qui définit la région de rejet 


na n a—1 n 
IL: Jo, (xi) » Ts) OT)  exp(—1 D 1 di) 25 
[is fo) 08 (a 2) exp (0 am) 


et comme #1 > 0 et 6 > 0, on a la région de rejet équivalente 


exp [en ra 61) s s) > ka 
i=1 


Finalement, la statistique de test est T = 57, X; et 
T> Ca, Si 00 > 01 


T< Ca, si 00 < 61. 


La valeur critique c,, est déterminée en approximant la distribution de T' 
par une loi normale. 


2. Si l'hypothèse alternative est H 1 : 0 > 60, on procède de la même manière 
et on arrive à 


RS < Co: 
i=1 


6.81 
Comme E(X) = À7!, les hypothèses sont 


Ho : ÀX=)0=1/30 
Ha : ÀZ1/30. 
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La statistique de test est 


DEN = 
RER à 


VAN 


La variable aléatoire Z suivant une loi normale centrée et réduite par hypothèse. 
La statistique de test observée est T © 27,6 et la p-valeur vaut 


p-valeur + 2 (1 — P(| Z |< 1,6)) = 0,11. 


On ne peut pas rejeter l'hypothèse nulle A5. 
Les seuils critiques k0,025 et ko,975 pour à = 5 % sont déterminés par 


VR(ko,025À0 — 1) = 20,025 


et 
Vn(ko,975 0 — 1) = 20,975. 


On trouve ainsi ko,025 © 27,06 et ko,975 © 32,94. 
La puissance du test 5 pour l’alternative À s’écrit 


BU) = 1 — Px, (27,06 < X < 32,94) = 
= 1-—P(Yn(27,06À — 1) < Z < Vn(32,94À — 1)), 


ce qui nous donne 6(1/25) = 95 %, B(1/28) = 25 % et H(1/35) = 88 %. 


8.28 


Soient les hypothèses 
Ho : H— 95 
HA : u<95, 


la statistique de test T — X et la variable aléatoire Z telle que 


Pie 


on 


La statistique Z suit une loi normale de paramètres (0,1) par hypothèse. 


1. Calculons la p-valeur 


94,32 — 95 
valeur = Py,(T < 94,32) = P[Z < ——— | = 0,012. 
A Ho ( ) ( 1,2/V16 ) 


Au seuil de 1 %, on ne rejette pas l’hypothèse nulle. 
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2. Pour calculer la puissance du test, il faut trouver la valeur critique ko.o1 : 


ko es 
Pa(T <k = PIZ< ———— |) —=0,01. 
Ho 0.01) ( 1,2/VT6 


On obtient 


La 
ND 


7 


ko,o1 = - 20,01 + 95 © 94,30. 


ie 


Si la vraie valeur de 4 est 94, l’erreur de 2° espèce est 


94,30 — 94 
Pa,(T > ko,o1) œ P (z > z 0,16 


et, par conséquent, la puissance du test est 
B(94) = 0,84. 


3. On aimerait trouver la valeur de n qui assure une puissance de test d’au 
moins 0,99. On utilise la relation suivante 


2 
Fe (a = —; 
(14 — o)/o 
où B est la puissance du test et a son seuil. Ici, on obtient 


2 
20,99 — 20,01 
= | | 231,3. 
É (as) 


La taille de l’échantillon n doit valoir au moins 32 pour assurer une puis- 
sance de 0,99. 


8.29 


Soit 1 l'espérance de l’augmentation du chiffre d’affaire parmi les clients de 
l'échantillon et soient les hypothèses 


Ho : H— 0 
HA : m>0. 
Soit la statistique de test T = X et la variable aléatoire Z définie par 
T == 
var(X) 


Par le théorème central limite, Z suit une loi normale de paramètres (0, 1). 
1. Calculons la p-valeur 


332 
p-valeur = Pr, (T > 332) = P (z > me) = P(Z > 3,07) = 0,11 %. 
On rejette l’hypothèse nulle, l’offre de la banque génère une augmentation 


du chiffre d’affaire. 
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2. Puisque Z suit approximativement une loi normale centrée réduite, on 
cherche un intervalle de confiance pour 4 tel que 
P(—20,995 < Z < 20,995) = 0,99. 
On trouve donc 


IC = [X + 209050] = [53,36 ; 610,64], 


qui, comme attendu, ne contient pas la valeur 0. 
3. Calculons la valeur critique ko,99 


PH (T > ko,99) =001 Ko,99 = 6: 20,99 251,64. 
On en déduit la puissance du test par rapport à l’alternative y = 150 


8150) = Pi=150(T > ko,99) = 


251,64 — 150 


4. Pour déterminer la taille n de l’échantillon qui assure une puissance de 
test égale à 80 %, on utilise la relation suivante 


= ( Z1-a — 21-6 ) 
(ua — po)/(6- VN)/ 
où N = 200 est la taille du premier échantillon. On a donc 


2 
n > a = 1 022. 
150/(108V200) 


8.30 


1. Soient Xz et Xw les temps moyens d'installation de Linux et de WinNT. 
En utilisant le théorème central limite, on a pour l'installation de Linux 
que _ 

XL — Hi 
Zi = = —> © N(0,1 
in (0,1) 
et la même chose avec Zw pour WinNT. 
Pour Linux, on à Tr © 167 et 61 © 14,4 ce qui donne l'intervalle de 
confiance à 95 % suivant 
14,4 


IC < 167+ 196-272 = [158 ; 176]. 
6 | 


En ce qui concerne WinNT, zw © 154, 6w = 8,19 et IC = [149 ; 159]. 


2: 


3. 
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On procède à un test de Student pour 2 échantillons. Les hypothèses sont 


Ho : Uri =hw 
HA : Hz > uw. 


Les variances étant différentes, on utilise la statistique de test 


qui suit approximativement une loi de Student à n — 1 degrés de liberté. 
La valeur observée de cette statistique est tr, © 2,54 et elle est supérieure 
au quantile {0,95 © 1,83 ce qui signifie que l’on rejette H5. On en déduit 
que les durées d'installation des 2 logiciels semblent différentes. 
(a) Maintenant que les variances sont connues, la statistique de test 
devient 


(b) T suit une loi normale centrée et réduite. 
(c) si z1-à est le a-quantile de la loi normale centrée réduite, la puis- 
sance du test s’écrit 


XL1-X 
PSP ae Pr = > 4-0 
Prtow 
= 1-p, [Æi=Xw)= (ur uw) |, _ (ur = uw) 
— HA VE 1-a T2oe 
EL WW. LE W. 
—. (ur uw) 


Z1-a — 
o? +0, 
n 


Cela signifie que 
1-8=® 0) : 
VOS +0 


donc 


(41 — uw) 
21-8 = Z1-a — Pr A 


2 2 
RS 1 — Li 


et finalement 


HL HW 10 


Voiton / | V25+I0 
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8.31 
On a la table de contingence 


Droits 


190 300 490 


Ne fume pas 210 500 710 
1200 


On teste l’hypothèse nulle H5: « la proportion de fumeurs est identique chez 
les droitiers et les gauchers. » Soit O;; la quantité réellement observée et E;; 
la quantité espérée sous l’hypothèse nulle pour la catégorie (à, j), où à = 1 si la 
personne est gauchère et j = 1 si elle fume. On obtient 


Où COiy = Ei5) 7 Bi 


Soit la statistique X? = 5°, se TE qui suit une loi y? à 1 degré de 
liberté. La valeur observée de la statistique est x?,, © 11,1 et on en déduit la 
p-valeur 

p-valeur = P(X? > 11,1) = 0,001. 


On rejette donc H, au seuil de 5 %. 


8.32 


Sous l’hypothèse nulle, Z + W(100,225). On compare les valeurs espé- 
rées sous l’hypothèse nulle par rapport aux valeurs réellement observées. Par 
exemple, pour la 1" classe, la valeur espérée est 


Ei = Eforo) = 1 000 - Py, (Z € [0, 70)) = 1 000 : 0,0228 = 22,8. 


observés espérés (E;) | (O; — E;)*/E; 


és (O:) 
Dr 550 
70.5) EX 
OU: I1S) QU 
15.180) 125.0 
RES 


La somme X? = 3 Ÿ_.(0; — E;)?/E; = 13,12 est la valeur sur l'échantillon 
de la statistique de test qui suit une loi y5. La p-valeur est ainsi 


| 
| 
[85.100 | 60 | 13 | 10 | 
| 
| 
| 


p-valeur = Pr, (T > 13,12) = 0,022. 
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On rejette donc l'hypothèse nulle au seuil de 5 % et on ne la rejette pas au 
seuil de 1 %. 


8.33 


Soit X; une variable aléatoire qui vaut 1 avec une probabilité p si la fleur à 
est rouge et 0 sinon. Les hypothèses que l’on veut tester sont 


Ho cho 
HA : p#i. 


Soit S — Su X; qui suit une loi binomiale de paramètres (500,p) et T la 


1= 


statistique de test définie par 
S — E(S) 
var(S) 
Par approximation du théorème central limite, T' suit une loi normale centrée 


et réduite. La valeur observée de la statistique sur l’échantillon est 


350 — 5003 


Lobs — 
1/500$+ 


et on en déduit la p-valeur 


p-valeur = Pas(| T [>| tous |) = P(IT |>| 2,58 |) = 2 — 26(2,58) + 0,01. 


œ —2,58 


On rejette l'hypothèse nulle à 5 %, mais la décision n’est pas claire à 1 %. En 
d’autres termes, la loi de Mendel n’est pas vérifiée pour un seuil de 5 %. 


8.31 


1. Il faut procéder à un test d’adéquation. On teste 


Ho : les réponses sont uniformément distribuées 
HA : Ho est fausse. 


On utilise la statistique du test d’adéquation du x? 


5 
ÿ-(Oi-E) 

X?2 = ( U u 2 X2. 
i=1 Ei ‘ 


Par l’hypothèse d’uniformité sous Ho, les valeurs observées ÆE; sont toutes 
égales à 13,4, ce qui donne 
22, = LA 96 + 12,96 + 31,36 + 5,76 + 29,16) — 2 = 6,06 
Fa ; ; ) ) ; 7 1384 AA 
Or, le quantile à 95 % de la loi y? avec 4 degrés de liberté est égal à 9,49 
qui est plus grand que +2,,. On ne peut donc pas rejeter Ho. 
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2. Il s’agit ici de faire un test d'indépendance pour tester 


Ho : l'appréciation est indépendante du sexe de l'étudiant 
H1 : Hjest fausse. 


Sur la base du tableau des fréquences espérées (E;;) suivant 


CT Bone [Moyennes | avais | Ton | 


Ca [#9 1 #3 [5 | 


on procède à un test d'indépendance du x?, avec la statistique 


ul 


E 


2 3 2 
x2=Y (Oiÿ — Ei;) 
= 1j 


i=1 j=1 


qui suit une loi y3 sous Ho. La valeur observée x2,, est 1,30, plus petite 
que le quantile à 95 % de la loi x2 qui vaut 5,99. On ne peut donc pas 
rejeter H5. 


8.39 


Soit l'hypothèse nulle H, « l’habitude et la préférence sont indépendants. » 
Sous H5, on aurait dû observer 


habituellement boivent 
Â B total 


55 55 110 
préféré | B 45 90 


100 100 


Soit X? la statistique de test définie par 


2 2 
ESS Bi + 
i=1 j=1 1] 


où E;; et O;; sont respectivement les quantités espérées et observées dans la 
catégorie (4, 5). Cette statistique suit une loi x? à 1 degré de liberté et la valeur 
que l’on observe sur l'échantillon est x2,, © 8,08. La p-valeur correspondante 
est alors 

p-valeur = P(X > 8,08) = 0,0045 


et elle implique que l’hypothèse nulle est rejetée ; l'habitude et la préférence 
sont dépendants. 
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8.50 


1. L'hypothèse nulle H5 est « la position de départ n’influence pas le résul- 
tat. » 

2. On fait un test d’adéquation du x?. 

3. Les valeurs espérées sous H5 sont 


Coiondedt _[I[2/5/1/5 [67/5 


Soit X la statistique de test que nous écrivons comme 


(OieE) 
E,; } 


X — 
il 


8 
i= 


où O, et E; sont les 5°” valeurs observées et espérées. La statistique X 
suit une loi x? à 7 degrés de liberté et sa valeur réalisée sur l'échantillon 
est x?,, © 16,33. On en déduit la p-valeur suivante 


p-valeur = P(X > 16,33) = 0,022 


qui conduit à rejeter l'hypothèse nulle à un seuil de 5 % et à l’« accepter » 
à un seuil de 1 %. 


SOL 


Soit l'hypothèse nulle H5 : « Il y a indépendance entre le niveau de dépenses 
et le statut professionnel. » Soit X la statistique de test telle que 


3 3 
RÉ SSS (Oi DE, 
i=1 j=1 1] 


La statistique X? suit une loi x? à 4 degrés de liberté sous l'hypothèse nulle. 
Le tableau des effectifs espérés E;; est le suivant 


CEE tonne [Temps paie sans profession 
Nos de 10 3 


De 10 8 à 25 9 
Plus de 25 8 


ce qui donne une valeur observée pour la statistique X? de x?,, © 17,25. 
On en déduit la p-valeur 


p-valeur = P(X > 17,25) = 0,17 %. 


Par conséquent, on rejette Ho au seuil de 5 % ou, en d’autres termes, le niveau 
de dépense et le statut professionnel ne sont pas indépendants. On pourrait 
donc conseiller aux responsables marketing de produits cosmétiques d’orienter 
leur publicité suivant le statut professionnel des femmes. 
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8.38 


1. À l’aide d’une table de contingence, on aimerait tester l’hypothèse nulle 
qui suppose l’indépendance entre le fait d’être daltonien et le sexe d’un 
patient. Récrivons la table sous la forme suivante 


Ou 
O1 


Sous l'hypothèse nulle, X? suit une distribution x? avec (2—1) x (2—1) — 
1 degré de liberté. La valeur observée de la statistique est x2,, = 27,14. 
La valeur critique de la statistique à un seuil de 1 % est environ 6,63. Par 
conséquent, on rejette l’hypothèse nulle; le daltonisme dépend du sexe 
du patient. 

2. On veut maintenant tester l'hypothèse nulle affirmant que les mesures 
suivent le modèle de fréquences tel qu’il est donné dans l’énoncé. La 
proportion de daltoniens mesurée dans l'échantillon est 4 = 0,044. Soit la 
statistique de test X? définie comme 


4 


O;- E;)? 
RE NN Ü à | 
i=1 Ei 


où FE; est la quantité espérée selon le modèle et O; celle qui est effective- 
ment observée pour l'observation i. La statistique X? suit approximati- 
vement une loi x? à 2 degrés de liberté sous l’hypothèse nulle. La valeur 
observée de la statistique est x2,, = 40 et donne une p-valeur égale à 0. 
L'hypothèse nulle est donc rejetée; les mesures ne suivent pas le modèle 
génétique. 


8.39 


Soit le tableau de contingence 


Chocolat 400 200 600 
Pas de chocolat 300 100 400 


00 [300 [7 000 
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qu'on paramétrise de la manière suivante 


CE 


On fait l'hypothèse nulle d'indépendance entre le fait d’être fumeur et de 
manger du chocolat. Définissons E;; = 0;:0};/0}} et la statistique de test 
X? comme 


Sous l’hypothèse nulle, X? suit une distribution y? à (2—1) x (2—1) — 1 degré 
de liberté. La valeur observée de la statistique est x?,, © 7,9 qui donne la 
p-valeur 


p-valeur = Py,(X? > 7,9) = 0,5 %. 


On rejette donc l'hypothèse nulle aux seuils de 1 et 5 %. Autrement dit, la 
consommation de chocolat est dépendante du fait d’être fumeur ou non. 


8.10 


On teste 
Ho : le poste est indépendant du sexe dans cette entreprise 
HA : Hjest fausse. 


La statistique de test 


calculée à l’aide du tableau des fréquences espérées suivantes 


D Lomme | one 


donne æ?,, = 24,90, qui doit être comparé au quantile 0,95 de la loi x3 qui vaut 
7,8. On rejette donc H5: la répartition des postes est bel et bien liée au sexe. 
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8.11 


On fait les hypothèses suivantes sur les peintures : 


Hoy : même comportement 
HA : comportement différent. 
On a 22 observations réparties dans g = 4 groupes (à = 1,...,4): n1 = n4 — 6 


et na = n3 = 5. Les moyennes des observations de chacun des groupes sont 
y1. © 87,67, y. = 89,6, y3. — 88,4 et ya. © 84,67. La moyenne de toutes les 
observations est y. © 87,45. Soient les deux statistiques 


4 
SSp — Sd nj(yi — 

i=1 

4 nn 
SSw = DD) (uw) 


i=1 j=1 


Les valeurs observées de ces statistiques sont sspos © 74,39 et sswobs © 
265,07. Soit F une nouvelle statistique définie par 


e SSB/(g — 1) 
SSw/(N — g)° 


où N — es Ni. 

Sous l'hypothèse nulle, F suit une loi de Fisher à g —1 = 3 degrés de liberté 
au numérateur et N — g = 22 — 4 = 18 degrés de liberté au dénominateur. La 
valeur observée de la statistique est frs © 1,68. Le quantile à 95 % de la loi de 
Fisher vaut environ 3,16. Par conséquent, on ne rejette pas l'hypothèse nulle ; 
on ne peut pas prouver que les peintures se comportent différemment. 


8.12 


1. La variable aléatoire Y; suit une loi normale d’espérance 0x? et de va- 
riance o?. 
2. L’estimateur des moindres carrés 0 mc de 6 est celui qui minimise la quan- 
tité 
nm 
5(8) = ÿ (Mi - 6x)? 


i=1 


On calcule la dérivée de S(8) par rapport à @ 


Ds @= 2 Y; — 02°) 
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et on trouve Ümc en égalant cette dernière à zéro 


n n 
) Yix? — mo D té = 0 
i=1 i=1 


3e Yi? 
re PE 


& Üme = 


L’estimateur est sans biais car 


à 1 L 1 É 
E(ôuc) = = DEV)= 70 2-0 
Din D Di D 
et sa variance vaut 
1 7 < 


var(Ümc) —= 


. Pour obtenir l’information de Fisher, commençons par écrire la log-vrai- 
semblance {(0 | y1, ...,Yn) de l'échantillon 


: 1 de. 212 
(Blum) = _ mi .. 


Il 

| 

| 
© 
ee 
ND 

| 
3 
© 
o 
Q 

ÿl 

. 
D 
BE, 


Dérivons-la une 1'° fois 
D 1 


puis une 2° fois (il faut noter que Ômc est également l’estimateur du 
maximum de vraisemblance de 0) 


®? 
002 (8 | y1, ... ; Ur) = ca DD 
L'information de Fisher J(0) est par conséquent 
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4. La variance de ômc atteint la borne de Cramér-Rao. Son efficacité est 
donc égale à 1. 


5. Soit T' la statistique définie selon 
27 a 
T — Din _ = mc, 


i=1 "à 


i=1 Ti 


avec T = N (e. = À On construit l’intervalle de confiance au de- 
gré (1— a) depuis 


8.13 


1. Construisons un intervalle de confiance pour a. Soit &mv l’estimateur du 
maximum de vraisemblance de a. Soit la statistique de test T' telle que 


D M, 
var(àmv ) 


La statistique T' suit une loi de Student à n — 2 degrés de liberté. On 
trouve alors l'intervalle de confiance suivant 


IC — éuv Etn-2:1-0/2V atamv)| ; 


OÙ {n_2;1-a/2 est le a/2-quantile d’une loi de Student à n — 2 degrés de 
liberté. De la même manière, on trouve un intervalle de confiance pour le 
paramètre f : 


IC = \Buv Ltn-2;1-a/2 Gr) : 


2. Faisons maintenant l’hypothèse nulle H6 : 6 = 0. La statistique de test T 
pour B sous l'hypothèse nulle est 
pie = PU —. 
Var(Omv) 
Cette statistique suit elle aussi une loi de Student à n—2 degrés de liberté. 
On rejette l'hypothèse nulle si la p-valeur est inférieure au seuil «& choisi. 
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8.44 


1. Nous avons la relation 


QI, = a+ BTC; + €, 
dans laquelle nous remplaçons la variable TC par 910 000 pour obtenir 
QI = mo + Bmo - TC = 1,74 + 0,00012 - 910 000 = 110,94. 


. Calculons à présent un intervalle de confiance à 95 % pour 8. On sait que 
la statistique T' définie par 


T = Buc -— B 
OV Sxx 


suit une loi de Student avec n — 2 = 38 degrés de liberté et on en déduit 
l'intervalle de confiance 


2 ô 
IC — (Ave + bars = 
20,99 
= 0,00012 + 2.02=—=— | = : 0. 21|. 
Lo 0 = [0,00003 : 0.00021] 


. Dans le point 2., on voit clairement que l'intervalle à 95 % pour B ne 
comprend pas 0 ce qui signifie que le paramètre est significatif et que le 
QI dépend de la taille du cerveau. 


8.15 


. L’ajustement n’est pas bon car les résidus ne sont pas distribués de ma- 
nière aléatoire mais plutôt selon une forme quadratique. 


. Proposons un nouveau modèle qui tienne compte d’une relation quadra- 
tique, à savoir 
2 
Yi = a+ it: + Paré + €. 


. Soit À la matrice construite comme 


et l'équation du modèle devient sous forme matricielle : 


(XTX)Bmo = XTY. 
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Soit L = D, €? = D (ys — à — Pix: — B2x?)? et les conditions de 


i=1 £i 
premier ordre : 


êL 

2 — 0 Di (ui — a — Bit; — 2x?) = 0 
Dr : A Di (gi — a — Bit; — Bar?) = 
de = Setu — a — Bt — Bax?)r° — 

4. Vu la forme quadratique et convexe des résidus, on peut supposer que, 


dans le marché immobilier, les maisons neuves aussi bien que les maisons 
anciennes ont des prix élevés contrairement aux maisons d’âge moyen. 


8.16 


1. L’intervalle de confiance à 95 % pour y vaut 


= ô 
I 5 = XX +— 
Cu, 9 %) are 
= 14+ 2 196 
100 
= 14+0,392 
— [13,61 ; 14,39] 


2. Soit p —« la proportion de ménages préférant un produit sans phos- 
phates », et 


pre 1 sile ménage à préfère un produit sans phosphates 
| O sinon. 


On estime la proportion de ménages qui préfèrent un produit sans phos- 
phates par pe X; qui est une variable aléatoire distribuée selon une loi 
binomiale de paramètres (100, p). 


On veut tester 
Ho : p—=0,25 
HA : p>0,25, 


à l’aide de la statistique 
Dir Xi — np 
np(l — p) 


qui suit approximativement une loi normale centrée et réduite. 
La p-valeur est 


Pa (3% : 30) _ P(z > =) = P(Z > 1,154) = 0,124, 


ce qui ne fournit pas assez d’évidence pour rejeter Ho au seuil de 5 %. 
q P P J 0 
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8.11 
1. Pour trouver l’estimateur des moments pour £ et 0, on a 
E(X;) = £+ V8 


et 


On trouve donc 


et 


2. Les estimateurs sont convergents s’ils convergent en probabilité vers la 
vraie valeur des paramètres lorsque n — co. Qu'en est-il pour 0 ? 
nm 
: L . 6 _— 
plim,_,…0m = plim se — ) (Xi — X)°. 
nT? < 
i=1 
On utilise ici la transformation suivante 


i=1 i=1 i=1 


On obtient alors 


CS _ 
i=1 
6 
= glar(Xi) — (E(X) — u)?) 
6 7? 6 2 
ap 7e at = 


L’estimateur 0m est convergent. Nous procédons maintenant au calcul 
équivalent pour l’estimateur € 


= £+yVO- V6 = Ë. 


L’estimateur Ë M est convergent également. 
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3. On cherche le biais de l’estimateur 0 M. Calculons son espérance 


E(ôm) = e(È £ =") 
6 n. 2 +2 6 2 52 
= 2 OX —nX )= = (E(XS) - EX à) 


= + (ar(Xi) + EX) — var(X) — E2(X)) 


= : (Ro e+ivor-Lo-(+iva) 
= g_0_ ni 


mn mn 


O. 


L’estimateur Ôu est donc biaisé 
Lee FA 0 
biais(O, 0) = ——. 
n 
4. On suppose à présent que 0 = 6. L’estimateur de £ devient 
Ëm — X =. V6. 
Par le théorème central limite, on a approximativement 
Êm — E(êm) 


var(Ëm) 


TT N(0,1), 


où 
E(êm) = E(R) - V6y = £ + V6 — V6 = € 


var(Ëm) = var(X) = —. 


Un intervalle de confiance au degré de confiance (1 — &) pour le para- 
mètre € est défini par les inégalités 


Em — Ë 
RS 
1-a/2 A 1-a/2 


Finalement 


2 T 
IC = LE LT ao) . 
5. La fonction réciproque de la fonction de répartition de la loi de Gumbel 
est 


q(a) = € — V6log(— log(a)), 


8. Inférence 237 


et g(a) est le a-quantile de la distribution de Gumbel. Le 0,9-quantile 
peut par conséquent être estimé par 


o,9o = Ëm = V6 1log(— log(0,9)) = X — V6( + log(— 108(0,9))). 


6. Une fois encore, le théorème central limite implique qu’approximative- 
ment . . 
do.o — E(Qo9) | N'(0,1) 
var (4,9) A 
avec 


Edo) = E(X)- V6(-—log(- log(0,9))) = 64 V6 log(— log(0,9)) = go, 


et 
var(o.o) = var(X) = —. 


Par conséquent, on obtient un intervalle de confiance au degré (1 — «) 
pour le quantile qo,9 


do,9 — 40,9 


—Z1-a/2 < Ven < Z1-a/2 
. T 
& IC = [40,9 uns Ra) 


7. Au vu des données observées, la valeur estimée du 0,9-quantile est 
do,o = 372,05 — 1,41 +5,51 = 376,15 €. 


8. La valeur de 374,80 € est en dessous du 0,9-quantile; ce n’est pas un 
niveau exceptionnel. 


18 
Soient les 3 estimateurs suivants 
Ru RE A 1 LE ? 
bi =X, Reid et 63 =n-min(X1,..., Xh). 


1. Les X; provenant d’une loi exponentielle de paramètre 9-!, on a E(X;) = 
0 et var(X;) = 02. On calcule alors l’espérance des estimateurs 01 et 0: 


E(&) = E(X) = E(X) = 6, 


et 
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Le 1° estimateur est sans biais et le 2° a le biais suivant 


n 1 
—0—=— . 
HN LÉ EE 


biais(2, 0) = 


On procède ensuite aux calculs des variances 


à 4707 
var(01) = var(X) = —, 
n 


et 
a 1 = n 2 
ar(d2) = -——— ATX) = —— 
Le mp 2,0" CE: 
On en déduit l’erreur carrée moyenne pour chacun des 2 estimateurs 


2 02 
ECM(6i, 0) = —, 
nm 


et ; 
ECM(02, 0) = 
(62,6) n+l 
2. Soit Y = min(X1,...,X,) une nouvelle variable aléatoire . On cherche 
sa fonction de répartition Fy(y) 
HG) PEU) POS CE) EE LE PCR CAE) 


= 1 P(X;>yVi)=1-(P(X > y)" 
1—(1-P(X <y)" =1-(1-Fx,(y))" 


1 (1 (1—exp(-y/8)))" = 1 — exp(-y). 


Il 


Il 


Ce résultat implique que Y suit une loi exponentielle de paramètre +. 


Ainsi . 
E(ÿ3) = n—=0  (estimateur sans biais), 
n 
À @? 
var (03) = ns =, 
et 


ECM(63, 0) = 82. 
La comparaison des ECM donne alors 
ECM(63,0) > ECM(61,0) > ECM(bo, 0) : 


le 2° estimateur est le plus efficace du point de vue de l'erreur carrée 
moyenne. 
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3. Pour tester la convergence des 3 estimateurs, on étudie le comportement 
de leur ECM lorsque n — © 


Les estimateurs 01 et CE sont donc convergents, mais nous ne pouvons pas 
conclure pour 63. Il faut alors regarder la fonction de répartition de 603 
qui est 


F5. (0) = P(ôs < t) = P(Y < t/n) = Fy(t/n) = 1 exp(t/0), 


où l’on a utilisé le résultat du point 2. Puisque lim, F3 (t) £ 1, l’esti- 
mateur Ü3 n’est pas convergent. 

4. Soit À = 1/0 et Z = À-min(X1,...,X,) une nouvelle variable aléatoire. 
La fonction de répartition F7(2) de Z est 


Fz(2) = P(Z <2)= P(A-min(X1,..., Xn) < 2) 
DORE 
= l—exp (-<na) = 1 — exp(—2n). 


La variable aléatoire Z suit bien une loi exponentielle de paramètre n. 
Par conséquent, le degré de confiance de l'intervalle de confiance pour À 
devient 
P(a/min(X:,...,Xn) < À < b/min(X1,..., X»)) = 
= P(a< \min(X1,..., Xn) < b) 
F7(6) — Fz(a) = 1 — exp(-bn) — (1 — exp(an)) 
—  exp(—an) — exp(—bn). 


Il 


8.19 


1. Puisque 


l’estimateur ch est non biaisé. 
2. Pour 0 <t < 6, la fonction de répartition de @ est : 


F5(0 = Pmax(Xi,.…., Xa) St) = P(X1 <t, ..., Xa <t) 


= oœisn= (5). 
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Aussi, la fonction de densité pour 0 < t < 0 est 
- OF, (t) PAL 
= NN — 


Jo, ôt = on ? 
d’où 
0 0 n n+1 |t=0 
2 t n + n0 
Elo) = | tf; (t)dt = LUN PRES _ 
(3) Î LA) Le n+i em | 


On déduit 03 = ÆHÿ, = ÆEL . max(X1, ..., Xn). 
3. On calcule les erreurs carrées moyennes. D’abord celle de Ch 


à : a Sn var(X;) 46 
ECM(6:,0) = var(d1) = var(2X) = 4 ee po 


Pour obtenir var(0), il faut calculer 


À Q ; 0 tri n tr+2 
E(05) = tf; (t)dt — — dt = —— 
= [er oa [ nas ET 


t=0 


t=0 
d’où 
ECM(É2,0) —  var(d2) + biais?(02, 0) 
= E(02) — E?(Ü>) + biais?(62, 0) 


n n 2 —0 \2 
_ sé -(—) P+(—) 
- n0? e2 
CEE CE ICE 
2 62 


n+D+2) 


Finalement 


1)? a 
UE ur) 
1 2 


n(n + 2) 


es 

Q 
Æ 

a? 
= 

Il 


Pour n > 1, on conclut que ECM (3) < ECM(:1) < ECM(6>). 
4. Les 3 estimateurs sont convergents. En effet 


x e? 
lim ECM(6:,0) = lim — =0, 
n—0o n—co 3n 
A 20? 
lim ECM(6,0) = Lin ———— =-0 
are (82,6) ao (n+l}{n+l) 
: e2 
lim ECM(3,8) = 25) 
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5. (a) Le taux de couverture de 1; est 


P(8EI;) = P(aô2 < 0 < bb) 


0 2 0 
. P(F<h<?) 
b a 


où l’on à utilisé la fonction de répartition de Ü> calculée en 2. pour 
obtenir la dernière ligne ci-dessus (par la condition 1 < a < b,on a 
bien que £ < 0 et £ < 6). 

(b) Le taux de couverture de 12 est 


P(8EI) = P(ô2+c<0<02+d) 
= P(0-d<Û <0-c) 


_ 0 —c = 0—d\" 
_ 0 Q \ 
où l’on a bien 0<0-c<80et0<0-d<0,car0<c<d<0. 


On remarque que le taux de couverture de l'intervalle Z dépend 
de 6, alors que /; en est indépendant. 


(c) Posons b = 2a. On résout 


1 nm 1 nm 
2) (2) = 0,95 
CRDRS 


1 1 
8 ( -x) = 0,95 
1 1 
ET 
To | x) 
& a (az1) 
7 705 me 
&.o0 
1. (k — 1) échecs avant un succès. 
k—1léchecs : prob =(1—0):(1—08)...(1— 0) = (1 — 031 


1 succès : prob =@ 
2. La log-vraisemblance s'écrit 


log P(X = k) = log Ü + (k — 1)log(1 — 6), 
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d’où l’on déduit les équations du maximum de vraisemblance pour 0wv : 


ô Cl ch “1 5,60 
> 36 18 PX He) (GE) 0 


nm 


T1 
Donc Ümv = —= à, 0 Ùù £ — n PR 
3. Par les propriétés asymptotiques de l’estimateur du maximum de vrai- 


semblance, on à que var(Omv) & 2 T0? où 


est l'information de Fisher. Ici on a que Le log P(X = k) = - 5 = 
et que 
JO) = + 7-0 
_ 0 (1—-0ÿ 
À lai 1 
_ @2 (1-0) (0 02(1 — 6) 
et donc mo ÿ 
À 1— 
var(Üuv) NA REC 
n 
4. Puisque E(X) = À on obtient Ô en résolvant + = k, et dans ce cas 
l’estimateur des moments est égal à l’estimateur du maximum de vrai- 
semblance. 
5. On calcule 
P(X>2) = 1-P(X=1)- P(X=2) 
= 1-0—0(1—-0)= (1-0)? 


6. P(X > 2)=(1- my)? = (L)° = 0,49. 
7. La statistique optimale est donnée par le lemme de Neyman-Pearson : 


Cr Pa (X = ki) DL LL RNA 
T —_—_—_—_—_—_—_—_—_—_—_—_—_——— — 
nes la (+) 


Il 
PÉRON 
S|S 
S | 
NN SE 

è 
_ 
em E 
un 
PT 
ES 

Pl 
d|S 
[®) = 
V2 

F 
| 
en 


ou d’une manière équivalente 


log(T) = n log (5) + (+) 2 ARE 1). 
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La statistique optimale est T(k, sk) EX ok =1);608k;272, 
et Ümv = _ n’est pas optimale. 
8. On peut utiliser le théorème central limite. Pour cela il est nécessaire de 


calculer E(T) et var(T), et donc E(log(X — 1)) et var(log(X — 1)), où 
X > 2. Ceci demande le calcul des séries 


Ellog(X —1)) — Set —1)9(1 — 6) 1 
k=—2 


= ie k)(1 — 8)*. 
k=1 


et 
E((log(X — 1)) = Ÿ_(log(k— 1))20(1 — 0)! 
k=2 
= OŸ (logk)?(1 — 0). 
k=1 
6.51 
1. L’intervalle de confiance à 95 % pour y vaut 
L 8 
I = X+ — 
C(u, 95 %) ÉNT 
1 
= 21,5 + 1,96-L8_ 
100 
= [21,15 ; 21,85 
2. On veut tester 
Ho : u—=21 
HA : u#21. 


Puisque la valeur 21 n’appartient pas à l’intervalle de confiance dérivé 
en 1., on rejette A6 au seuil de 5 %. 


3. Soit x la vraie proportion de ménages qui consomment moins de 20 kg 
de pain par mois. On définit 


ee 1 sile ménage à consomme moins de 20 kg/mois 
© | O sinon. 


On utilise FT = x pour construire l’intervalle de confiance 


F1 À) 


IC(r,95 %) = À + 20,975 


= [0,23 + 1,96 : 0,042] 
= [0,15; 031] 
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4. On a l'intervalle de confiance 


IC(u,95 %) = 


&a1 
L 


S 
Fe 
1,8 
= 21,5+ 1,96 — 
i TT 


= (20,44; 22,56] 


Cet intervalle est plus large que celui trouvé en 1. En effet n est plus 
petit, l'IC est donc moins précis. 


8.02 


1. La fonction de distribution d’une variable aléatoire X suivant une loi de 
Dagum s’obtient par la dérivation de F3(x) par rapport à x 


—B—1 
26 1 
x 
La vraisemblance d’un échantillon de taille n de variables aléatoires sui- 
vant une loi de Dagum est alors 


i=1 Ê 


et sa log-vraisemblance 


nm nm 1 
U(B | t1, ..., Zn) = nlog 2+n log 8-3 logzx;—(8+1) Ÿ log (: + à) : 


i=1 i=1 


On obtient l’estimateur du maximum de vraisemblance re de 5 en opti- 
misant la log-vraisemblance 


0 n 1 


> Ê — 


Dr log (i + à) | 


2. Pour calculer l'information de Fisher J(6), on dérive 2 fois la fonction 
log fs(x) par rapport à B 


Ô 1 1 
95 18 fs(x) = 5 — log (: + à) 


8. Inférence 245 


qui donne 


9 = 


Par conséquent U 
Vn(B — 8)" N(0,6°). 


3. On a généré 100 000 échantillons de taille n — 16 avec 6 = 1. Calculons 
la probabilité d'obtenir une valeur de l’estimateur 5 comprise entre 0,5 


et 1,5 
Pose ns) ee ARE Ve). JR) 
var varÜ varB 
a pf_1  VRË-# 1 
8 à 8 
var 


On aura approximativement 10 000 échantillons où la valeur de l’estima- 
teur sera comprise dans l'intervalle [0,5 ; 1,5]. 
4. On peut écrire 


Ce 2 
A (5-1) -vr6 B). 


Donc, /n ( £ — 1) suit approximativement une loi normale d’espérance 
5 PP 


nulle et de variance 1. Construisons un intervalle de confiance au de- 
gré 95 % pour B 


P (ae < Vn É A ) < non) — @;, 


où Z1-a/2 est le «/2-quantile de la loi normale centrée et réduite. On 
déduit donc de l'inégalité précédente 


8.03 


1. Calculons l’espérance de X 


1 
E(X)= | ax dx = —— 7°+1 
0 [62 
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L’estimateur des moments à de a est donc 
ra _ 
M 1=X g(X) 
2. Pour connaître la variance de X, il faut chercher son 2° moment 


æ=1l 
(07 


a +2" 


1 
Ex = | ar Tldx = — 742 
0 a +2 


On en déduit 


(a +2)(a +1)?" 


Finalement 


— a 
Xp)  NTO, ——— 
VAE ( sex) 
car X n’est pas biaisé. 
3. La dérivée de la fonction g(u) par rapport à y est 


Oeil 1er) rene 
On Qui-n oi\i-n Q—u)? 


La variance approximée de à est par conséquent 


mu (H) EE 


n 1—u n  n(a+2) 


4. Pour tester la convergence de l’estimateur à, calculons sa limite en 
probabilité 
X plim X es 


"TRI X 1-plim,X 1-2 


N— 00 


L’estimateur est convergent. 

5. L’estimateur est efficace si sa variance atteint la borne de Cramér-Rao. 
Il faut donc calculer cette dernière. Reprenons la fonction log f,(x) et 
dérivons-la à 2 reprises par rapport à @ 


Pise = 2 (log a + (a — 1)logx) = = + log x 


(02 


O0a 
0? 1 
ce az 108 fa (x) = Er: 


On en déduit l'information de Fisher J(a) 
1 


J(a) = 


2? 
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et la borne de Cramér-Rao pour un estimateur sans biais de a 


2 
BR=TE, 
n 


Comparons-la à la variance de à 


œ? a a +1 
À) — BER = — — © = ——. 
var(@u) n  n(a+2) n(a+2) 


Ce résultat est toujours positif car & est positif. Ainsi, l’estimateur n’at- 
teint pas la borne; il n’est pas efficient. 


6. Par le théorème central limite 
VE =) IS N(0.1). 
var(@m) 


On peut donc construire un intervalle de confiance approximé au degré 
95 % pour «: 


Vr(âäm — à) 


P (- < = 
var(@) 


< vs) = 0,95 


var(@) 


& IC — D 20,975 


8.51 


1. Le statistique X donne le test le plus puissant lorsque X; + W{(u, o?) (cf. 
lemme de Neyman-Pearson). 
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on j' 
P(PV>a) = P,(1-® (=) > a) 
CES a) 
2, B: — <&-l(1- o) 
= P, (z <®-l(1—a)+ . 
= Cat a) +; 
4. Lorsque y = go, la distribution de PV devient 
PAUPV <a) = LB, (PVS 4) 
= 1-®&(®7"(1-a)) 
SR) 


ul 


ce qui veut dire que la distribution de PV est uniforme sur l’inter- 
valle (0,1). 
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